【AI创新者】是CSDN人工智能频道精心打造的专栏,本期主人公是驭势科技CEO吴甘沙。
记者:王艺
更多【AI创新者】征集中,采写AI领域杰出学者、资深专家、技术缔造者、顶尖团队。寻求报道请邮件[email protected],或扫描文末二维码加我微信。
驭势设计车的逻辑是顺的。
2017年初,在美国拉斯维加斯CES展上,驭势展出了其首款无人驾驶概念车,并命名为城市移动空间(而媒体称之为移动包厢和移动吧台)。
美国时代周刊汽车栏目特邀主编Alex Roy在CES现场看到驭势展出的无人车后,戏称道:“北京会是世界上最先进的自动驾驶市场,当我看见这辆车的时候,我觉得这才是法拉第未来该造的车,但是他们却在制造比这个复杂很多、而且非常昂贵的汽车。他们怎么会想不明白,人们需要的是一款价格合理而且能共享的无人驾驶车呢?”
一席话道出了驭势移动包厢的精要所在:简单舒适,适合共享,成本低,然而其背后所蕴含的逻辑不只如此。驭势为移动包厢找到了一条快速商业化的道路,即首先定位在运行于园区、景区、度假村、主题公园和机场等半封闭环境的低速无人驾驶车。
何谓低速?对于这个问题,吴甘沙特别请教了交通方面的专家,得到的答案是,时速70公里以下为低速,70公里以上为高速。纵观北京城区,五环限速90,四环80,很多路段限速60,实际上在北京市内开车的平均时速为20多。这就意味着,如果将时速70公里以下的无人车技术做好,在未来也会有很大的应用场景。
为何选择园区落地
目前无人驾驶厂商的切入点主要有两种,一种是通过高速的辅助驾驶切入,一种是通过半封闭场景的低速无人驾驶切入,驭势选择了后者,但并不意味着简单。从传感器配置到算法复杂度,半封闭场景的无人驾驶与城市区域的无人驾驶相近。半封闭场景复杂多变,在算法层面构成了挑战。反倒是高速辅助驾驶的算法复杂度偏低,因为在高速公路上,汽车都在很规律地前行,不规则运动物体较少。
而另一方面,高速对系统鲁棒性的要求高,毕竟高速事故一旦发生,后果多半是车毁人亡。低速无人车在避障和安全手段上有更多的选择,事故的严重性也较低。
挑战即机遇,吴甘沙谈到:“今天的机器学习算法最怕的就是不确定的开放环境,因为从本质上来说,它是一种基于特定数据集训练的归纳法。它看到过的,就懂,没看到过的,就傻。我们现在的自动驾驶算法还是弱人工智能,或者叫窄人工智能,没有达到通用人工智能的地步,不能根据常识判断、不能做因果推理、也不会举一反三触类旁通。所以在新一代的智能驾驶算法出现之前,我们必须要让它见过所有的场景才能确保万无一失。在很多半封闭环境里,我们能够更容易地将所有场景收入我们的数据库中。”
会说话的无人车
作为在景区园区中运行的“观光车”,驭势在整个车体的设计方面花了不少心思。移动包厢的整体设计是一个完全的正向工程,不是在现有汽车的基础上进行改装,而是以实际的应用场景需求为导向,打破了人们对汽车的很多程式化印象。例如整个车厢采用木地板及L型沙发设计,360度的视野符合其“观光车”的定位。
在人类与车辆的交互方面,移动包厢头部外侧装有LED显示屏,作为与行人的交互组件。当移动包厢想让面前的行人先过的时候,显示屏上会显示一个正在行走的绿色小人,提示行人先走。
在车厢内部同样装有与车内乘客交互所用的大屏幕和摄像头,乘客可以通过这块屏幕选择去哪里、领导视察时可以开视频会议、朋友不能亲临景区时可以玩直播、查看当地的风土人情介绍等。同时必不可少地,车上装有紧急刹车按钮。
无人驾驶的安全保障
在无人驾驶汽车最关键的激光雷达方面,为了降低成本,驭势采用16线的激光雷达,并通过后台算法补足精度。通过激光雷达、双目立体摄像头、超声波雷达、以及毫米波雷达的叠加,实现了360度无死角的传感器覆盖,且每个角度都有冗余,互为备份,以保证安全。
对于记者的疑问:“为什么谷歌等其他公司不采用这种成本更低的方案?”吴甘沙解释道:“俗语说,由俭入奢易,由奢入俭难。如果说过去八年的研究过程中,我一直在采用64线的激光雷达,早已形成了这种路径依赖,最早的代码也是在64线激光雷达的假设上写的,那我想要改变是很困难的。”
然而安全单靠摄像头的互相备份并不能保障,2016年六月,特斯拉无人驾驶发生的车祸仍历历在目,今年三月Uber无人车又被撞翻在地。美国兰德公司的研究表明,无人驾驶技术需要经过一百亿英里的测试,才能有95%的置信度证明自动驾驶是比人类驾驶安全的。一百亿英里意味着,一辆车连续跑500年。不仅如此,这一百亿英里中的每一英里,系统测试的场景不能是太单一的。难度之大,成本之高,可想而知。
针对这一问题,最近,驭势在做一项很有趣的研究,利用高度逼真的模拟器进行测试和训练。未来这样的系统可以通过强化学习,不断地与不同场景和决策算法进行对弈,左右互搏,让无人驾驶的决策系统越来越成熟。
一句大话引发的五个月造车
驭势设计无人驾驶汽车的举动缘起于吴甘沙在2016年4月份与世界范围内最知名的人工智能记者,也是《与机器人共舞》的作者约翰马尔科夫的一次谈话。当时,吴甘沙一拍脑门,说了句大话,要在明年的CES上推出一款无人车。
“我们也没想到怎么搞着搞着就真的把这辆车搞出来了,因为当时说过这句话之后,冷静下来我就有些后悔了。我们是一家创业公司,没有太多的资源去做这辆车,但人说话是要做数的。于是我们五月份开始策划,十月份差不多做完,汽车成型之后开始调试系统,装船运输,这是一个很漫长且紧凑的过程,每一个时间节点都不能耽搁。”
对于驭势内部有何方神圣,能让移动包厢在几个月内横空出世,吴甘沙表示,全时参与的员工不超过两人。“马克思主义的生产资料所有制已经OUT了, 我们现在提倡的是生产资料租用制,这里的生产资料也包括了大脑。我们想办法找到了一些很有想法的汽车设计师,找到了一些很厉害的研究交互设计、用户体验设计的教授。大家一起坐下来头脑风暴,我们把之前对于汽车的所有思维定式都抛掉,从0开始设计。"
"我们经历了大量的争论、碰撞、修改。我们设置一个特定的时间节点,到这个时间点大家要停止争论,达到一个统一的共识。然后我们请一个专业的团队做了一个油泥模型出来,大家再轮番上阵,在油泥模型上‘比划’自己所负责的模块,比如传感器、交互组件。当你面对这个真正的1:1的油泥模型的时候,你才对这辆车有了真正的空间感。”
智能驾驶现在要做三件事,吴甘沙形象地总结为:新司机、认路的司机、和老司机。
新司机要有眼睛,即指基于计算机视觉的感知系统,包括各类摄像头(单目、双目、三目)、激光雷达、毫米波雷达;认路的司机指高精地图,涉及到定位、惯性导航、SLAM等技术;老司机开车要做到舒适,不肉,不慌,能与如狼似虎的人类司机争夺路权,且在遇到无法处理的情况时能优雅地降级,交由人类操作,即认知决策。
在这三个层面,驭势都在发力,但吴甘沙坦言,“想把第一块做的非常好已经很不容易”。
在计算机视觉层面,驭势以格灵深瞳的汽车视觉团队为基础,引入来自产业界和高校的人才,具备了算法到工程再到上车的能力;在高精地图层面,由于在中国做公共道路地图需要资质,但园区、旅游区内部的高精地图是可以做的,这也是驭势聪明的一个方面;在认知决策层面,吴甘沙表示,不一定需要等通用人工智能的时代到来,“我们现在提倡Stronger的Weak AI”,但即使这样还是有很长的路要走,涉及到迁移学习以及预测学习,“这也是为什么我们急需算法人员”。
愿意等待人才成熟
说到招人,驭势讲求四有,即“有种,有趣,有料,有情义”。对于业界普遍关心的学历问题,倒是没有过多的提及。吴甘沙表示:“以前我们招人是很苛刻的,团队一半是博士,一半是有五六年以上经验的硕士。现在我们不这样想了,看准了这个人,就算是本科生都招。"
"一个是因为现在人才成本贵,无人车的老法师塞巴斯蒂安.特龙曾经拿Otto举例说现在平均一个智能驾驶专家值一千万美元;再一个是原本市场上已经成熟的研究人员不多;最重要的是,我们愿意等人才成熟。我们已经建立了一个良好的培训系统,对于资质较高的软硬件工程师,不出三个月就能将自己的程序烧到车上去试验了。我相信我们的工作环境对于热血的极客青年来说是相当有吸引力的,毕竟很多年轻人都爱车,我们有各种各样的车让他们去玩。"
"当然,你要有一种使命感,你要能意识到你在做一件非常有意义的事情,无人驾驶能够解决今天城市的很多问题,比如堵车、废气排放、交通事故、停车难、通勤时间长等问题,你要明白你的工作是跟一件大事业联系在一起的。”
目前驭势团队已经有50多人,每个人都有明确的职业发展道路。驭势在建立一套有趣的职业阶梯制度,每一个级别都能找到一个大家熟知的“大神”作为参照,比如在工程师方面,将Jeff Dean作为最高级的参照,这就意味着,只要没到Jeff Dean的水平,你就有级可升,CTO也不例外。
做无人驾驶的赋能者
驭势希望成为无人驾驶的“赋能者”,赋能的方法是提供核心的技术和解决方案。“我们在不断地调整我们的思路,因为我们的方案最终是要与整个生态中的其他产品做集成的。现在低速无人驾驶还不存在生态链,那我们就要多做一点。你看现在我们将整车的设计与实现都做出来。"
"慢慢地,别人会做车了,我们只需要提供大脑和传感器的组合就好了。那个时候我们做一个智能化的平台,别人在这个平台上做车的外形、内饰的设计,以及内容的接入。在其他的场景下面,光有这个平台也不够,我们还要去触碰一些基础设施的运营维护以及数据处理方面的问题。"
"因为最后我们的目的是去促进这个生态系统的自我强化和繁荣。马路上跑我们系统的车越多,对我们越有利,这是一个正向反馈的过程。数据越多,我们的算法就越好,我们的平台就越好。”
目前,驭势已经和一些园区达成合作,正在部署其无人车项目。吴甘沙又说了一句大话,今年要让五六十辆车跑起来。
“其实在CES上造车并不难,按照时间节点一步一步走就好了,恰恰难的是我们目前的处境。现在我们在同时推进好几个项目,这些园区不都在北京,而且是针对不同的场景,这对于我们来说又是一个从0到1的过程。这导致对于实际落地过程的复杂度,我们不能在一开始就很好地进行估计。在项目的需求分析阶段我们认为这件事可行,但是在实际的试跑过程中又会有新的复杂性冒出来,这对于我们来说也是在不断学习的过程。我们专门请了一位做统筹学、做工程管理的人员来进行人员调度,每一位员工的时间精确到天。”
主流市场的边缘式创新
对于自身业务的定位,吴甘沙将驭势的园区低速共享无人车定义为凯文凯利口中的边缘式创新。“我们也不能完全说自己处在蓝海,经典的蓝海定义是指在红海之外有一片更大的海域。但我们的海域呢,其实就这么大。是在主流市场边缘的一块市场,它规模小、利润薄、风险大,以至于主流玩家不愿意玩,这样就给了我们创新公司以生存之地。在这块海域里,你如果做得风生水起,那么你可以选择扬帆远航,或者把这块海围起来做自己的内海。”
在采访即将结束的时候,记者谈到若当年吴甘沙再在英特尔坚持个一年半载,就可以拿到一笔可观的期权。吴甘沙淡然一笑:“你不要在乎那些事情,重要的是时间。”
【AI创新者】专栏精彩文章:
CNN之父Yann LeCun:预测学习才是AI的未来
小蚁首架张骏峰:让图像AI人尽可用
Twitter施闻哲:图像质量的评判标准是超分辨率的下一个关键
云知声梁家恩:当 AI 遇见 IoT——云知声的 AI 之路
TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择
TensorFlow 贡献者唐源:掌握 Google 深度学习框架的正确姿势