主题:智能驾驶分论坛
时间:2017年5月22日上午
地点:国家会议中心401
本文根据速记进行整理
自主驾驶传感技术
肖峰
北京峰云视觉技术有限公司CEO、斯坦福大学博士
邓伟文/主持人:下一位演讲人是肖峰博士。肖峰博士是北京峰云视觉技术有限公司CEO,峰云视觉是以3D成像和视觉学习为主的公司,肖博士也硅谷中关村数字创新联盟,主要由海内外华人和高端企业组织组成的,他们公司是专注于人工智能和虚拟现实方面的核心技术开发和应用,肖博士先后在美国德州仪器,安捷伦,摩托罗拉等公司担任高级研发和管理职位,并连续3年担任ISTSPIE竖子成像会议的共同主席。主要兴趣集中在高性能的成像系统、图像传感器,图象处理算法和芯片、31视觉技术,人眼视觉系统和嵌入式视觉方案在消费、汽车和工业等领域的应用。
肖峰:刚才我们听了两个演讲,我需要中文和大家进行演讲。今天的题目是自动驾驶中间的传感技术,主要就是一个综述。刚才介绍了,我们峰云视觉主要是做3D成像有关的工作,包括硬件和后面的算法,应用在消费,VRAR有应用,但是像工业自动化和汽车里面也探讨这方面的应用。
去年人工智能是科技界的热点,尤其像自动驾驶,基本上每天都有很多新闻发布,为什么这么多公司现在感兴趣呢,对自动驾驶。简单可以看一下,2016年,汽车全球销售了8500万辆,产值2万多亿美元,可以看到,苹果市值还比不上汽车的市值,苹果现在要扩张,谷歌也要扩张,汽车市场是它看到的最大的一块饼。自动驾驶,原来美国国家高速公路安全局有一个老的规定,分成四级,在去年9月份采取了国际汽车工程师协会推出的标准,大家觉得从汽车厂商的角度,从定义和测试的角度更加方便,分成了5级。0级,没有自动驾驶,平常我们看到大家买的行车记录仪,它会给你一些碰撞距离的警告,这个属于0级,自动控制不参与车的控制。1级一个简单的说法,手还是要放到上面,像自动跟车,计算机会给一些辅助,两个人开始共同参与对汽车的控制。第2级,手就可以拿开了,就是在大部分情况下,你手可以拿开,但是如果汽车告诉你马上停止的话,就马上停止,这个属于手不靠近它,但是必须放在上面,每周一些州还是强制的,手必须一直放在方向盘上。第3级,就是你的眼睛可以拿开,这个时候我们发现和2级有一些相似,主要的差异就是对2级自动驾驶,一旦出现危险情况马上就要控制,但是对第3级,可能不同的车厂不一样,可能会告诉你5秒10秒的时候,你再反应是没有问题的。线上线下最领先的公司,特斯拉是最领先的,我们看到很多公司发了很多新闻,说在哪一年要做到第5级的自动驾驶,其实大家现在的水平都是属于最多是2到3的阶段。第4级,简单讲就是开车的时候,你可以在车上睡觉了,基本上汽车不需要驾驶员参与,但是对于自动驾驶这块,它可能限制到一些区域,比如说政府规定某些城市某些道路是可以进行无人驾驶的,或者在特定的情况下。我们注意到,对于目前做的所有自动驾驶的测试,都是在光线很好的,在公共的道路上测试的,现在像雨雪天气,夜晚,听说只有福特在进行雪地上的测试。最高一级第5级,不需要驾驶人,就是真正的无人车,它的挑战就是,只要人能开车到的地方,这个车应该都能到,这就是一个总结。
下面从自动驾驶的技术该度分三大块,第一块就是传感Sensing,第二就是Mapping,第三就是Driving Policy。现在讲传感,就拿几种在自动驾驶上的传感技术,它分为四大类,这是一个简单的概念,大家可以看到,雷达是毫米波雷达,还有普通的相机,还有专门为了夜视准备的红外和热成像的传感器。还有最普及的就是超声波的传感器,基本上中国每个车上有很多,现在最热闹的就是激光雷达,还有惯性测量,或者GPS,这里就不讨论了。
这四个主要传感技术分类怎么看呢,它们都属于检测和测距的范围,差别就是相机属于Passive,不主动发射能量,分成夜视和普通的。这就带来一个问题,特斯拉它是2016年有一个非常著名的实验,一个大卡车,特斯拉就开到大卡车里了,大卡车的侧面是白色的,跟天上的白云分不开的,这就是非主动的传感技术,因为没有(英文)背景,它区分不开大卡车的背面和白云。其他三种技术,像雷达、超声和激光雷达,属于自己要主动发光源的。现在毫米波雷达是三种,24G主要是自动跟车用的,现在技术投入比较大的就是77G和79G,毫米波雷达和其他雷达最大的优势,唯一一个全天侯的,晚上和白天,下雨下学这种恶劣天下都可以全天侯,而其他的技术都是有这方面的限制。激光雷达像谷歌的7万美元的雷达,很贵的,大家希望从7万美元,两年之内成本减少到100美元左右,这样就可以大量的应用。
这里做了一个概念性的比较,对相机来讲它有一个很大的因素,它可以识别路上的行车速度。天气好的话,距离可以看到1公里,成本也很低,但是它主要的缺点,我们刚才讲了,对晚上,对雨雪天气有好的适应,还有计算量大,成本很低,现在汽车上用的相机,模组一个是30美元左右,我们知道特斯拉比第二代的系统,用了8个相机,我们可以算一算它的成本,这是一些主要的供应商。毫米波雷达距离可以到250米,最大的优势就是唯一一个可以在恶劣条件下全天侯工作的技术,计算量比较小,速度的测量也是非常好。主要的缺点就是很贵,毫米波分辨率很低,路上的lane,线和线之间的间隔看不出来,成本77G是主流的,300美元左右的样子。激光雷达,包括谷歌的公司,我们发现很多新公司都用激光雷达做,做出的原形最快,距离是最好的,Mapping也是很好的,目前就是很贵,而且非常大,在雨雪天气有很大的问题,成本也很高,现在是8000美元,今年可能出250美元,每年可能出现小于100美元的。
自动驾驶最后是要看场景,除了技术之外应用到什么场景,我们列了三个场景,第一个就是非常理想的天气,现在很多车测试的时候,天气很好,光线很好,这个时候我们发现相机是最好的,除了刚才讲的,如果一个大卡车没有任何纹理这是一个问题,其他的情况下相机是最好的。距离,包括空间分辨率非常好。雷达和毫米波雷达差不多,也是200多米的样子,分辨率会低一点,超声是很小的范围,在这个情况下大家表现的还行。
下一个阶段,还是没有雨雪,但是光照降下来了,我们发现激光雷达和毫米波雷达不受影响,最受影响的就是相机,但是相机有夜视,这个成本比较高。这个是最有挑战性的,最后真正做到第5级的自动驾驶,肯定在恶劣的条件下,下雨,下雪,恶劣的条件下,这是躲不过去了,性能基本上没有改变的就是毫米波雷达,视觉和激光雷达都受到了很大的影响。
刚才讲了几种情况,现在做自动驾驶不同的公司,分两个主要的阵营,一个是以Mobileye为代表的,还有特斯拉。谷歌和百度,Uber,他们觉得雷达应该是自动驾驶的核心,我们发现很多初创公司不用问都是用激光雷达。这是两个阵营的比较,但是有点不公平,我们只写了激光雷达,从各个角度来讲,从距离,近距离的检测,分辨率,天气条件,雨雪,读路标,成本,各个角度来讲,如果用相机和激光雷达在一起基本上没有短板了,而且成本还可以接受。像特斯拉比较成熟产品,跑了很长时间,对他们来讲这是很务实的方式。如果是激光雷达,首先雨雪天气的时候成本很高,激光雷达可能也会加毫米波雷达这块。
后面细分一下,特斯拉的自动驾驶,目前认为特斯拉是自动驾驶最领先的公司,到现在为止它已经有1.3亿公里的数据搜集了,谷歌最新的数据是300万,它已经是1.3亿公里的搜集了,1的毫米波雷达,8个相继,12个Ultrasonic,特斯拉说我已经可以做到第5级了,只是政府那还没有开放,一旦车子应用以后事故率下降了40%,而且去年5月份发生了第一期特斯拉在自动驾驶方面死亡的事件,它的解释是1.3亿英里的里程1个死亡事故,平常的车是9400万英里,比个还要好,主要是相机分不清卡车上的图和天气的分辨。这是原始的图像光流,深度,把两个整合起来,对应整个图形分类,开始把车道画出来,这是它细节的东西。这是谷歌自己打造的车,这个车没有方向盘、刹车、油门,最显眼的就是64线的雷达,7万美元的样子,它也有毫米波雷达。谷歌自己二三十台车,到今年5月底只有30我万英里,中间14次事故,谷歌的解释是有13次是对方的事故,都是别人的错误,还有1次是因为他们驾驶员干预了。像谷歌的自动驾驶汽车,它需要非常高精度的地图,这也是谷歌的强项,需要到英寸级别的路线地图,而且它智能时候不像特斯拉,我从哪里到哪里,路线必须规划好,这是它最大的局限,它不能自由的驾驶。
最后这一页就是一个简单的市场预测,特斯拉8个相机,前面3个,一个正常角,还有广角的,对相机来说成长是最快的,差不多2019年至少每一辆车上有一个以上的相机。谢谢大家。
提问:现在传统的汽车厂商做无人驾驶,据我所知通讯界也有车辆通讯的标准化的研究,请问您对车辆通讯工作在未来自动驾驶有什么样的看法?
肖峰:车联网我不是很熟,我主要是对相机比较熟。
李德毅:相机核心作用是什么,比如对交通牌的话,这个是给人看的,你认为像机不可或缺的是什么?
肖峰:李老师讲的非常好,如果我们在平地起一个空城,这个自己自动驾驶车才能开,包括像车联和雷达,但是在混合的情况下,在过渡的阶段,相机还是不可替代的,所以它成本很低。刚才讲了不可替代性,有一个问题,只要有人参与,相机就缺不了,现在大家讲雷达和毫米波雷达一个最大的问题,为什么从3到4很难,平常我们路上载一些装置,警察让你提一下,雷感的雷达就直接开过去了,像谷歌原来地上有一个沙袋,它觉得很大,它主动就偏移了,只要牵扯到有人,路人或者对面的车里有人,我觉得相机是不可代替的。
提问:您觉得相机在光照,我们在使用的时候经常会遇到,比如阳光强的时候。
肖峰:这个包括红外传感,强感,但是这个比较贵。普通的传感器做的相机也可以做到星光级的,有方案,比较贵。
提问:在什么量级?
肖峰:可能是在一千多人民币。
邓伟文/主持人:谢谢肖博士。
CAAI原创 丨 作者肖峰
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会