专栏名称: 深网腾讯新闻
《深网》是一档原创深度报道栏目,挖掘TMT领域热门公司、事件和人物中的隐秘故事,探究背后的深层逻辑。
目录
相关文章推荐
新北方  ·  男子相亲称“机关工作、年收入35~40万”? ... ·  19 小时前  
新北方  ·  注意带伞!本周要有两场雨 ·  2 天前  
51好读  ›  专栏  ›  深网腾讯新闻

百度谷歌特斯拉加码背后,萝卜快跑带出AI智驾的千亿赛道机会 | AI光年

深网腾讯新闻  · 公众号  ·  · 2024-08-09 09:27

正文

来源 :视觉中国

特约作者丨险峰长青投资人徐真  编辑丨薛芳


出品丨深网·腾讯新闻小满工作室


似乎是一夜之间,无人驾驶突然火了。

7月,百度旗下的「萝卜快跑」的无人驾驶出租车在武汉大面积铺开,几乎每天都在制造新闻。

据报道,萝卜快跑单日单车峰值超20单,已与出租车平均日单量相近,且乘客体验更好、更舒适。从保险数据看,萝卜快跑的出险率仅为人类的1/14,目前安全行驶超过1亿公里,没有出现一例重大伤亡事故。

而大洋彼岸,马斯克也宣布将在8月发布特斯拉首款无人驾驶出租车Robotaxi(后推迟至10月),他表示车主可以在空闲时间将Robotaxi投入出租业务,两年内即可收回购车成本。

无独有偶,7月23日谷歌也宣布将对Waymo追加新一轮50亿美元的巨额投资,以“保持Waymo世界领先自动驾驶公司的地位”,要知道当年微软投资OpenAI也只花了10亿美元,50亿美元已经接近waymo历次融资的总和。

事实上,今天无人驾驶的爆发绝非偶然。站在业内视角,过去3年也是自动驾驶技术发展最快的3年,几乎可以说是“一日千里”。

从目前中美两国的进展来看,如果抛开立法标准和时间的羁绊,无人驾驶很可能将在未来1-2年内投入全面商用,在5-10年达到端到端的“完全体”,实现类似科幻电影中的无人驾驶形态。

从这个角度来说,虽然现在谈论无人驾驶的“iPhone 4时刻”或许还为时尚早,但无人驾驶的时代奇点的确已经到来。

与此同时,这也是一场与时间的赛跑:中美作为全球自动驾驶企业数量最多的两个国度,谁能率先跑通并建立起相关产业链,谁也就有了定义赛道、向其他国家输出技术产品的能力。

站在中美科技竞争的大背景下,这对任何一方来说,都是一场“输不起的战役”。

在本文中,我们将从自动驾驶的发展史入手,尝试来推测下行业未来的发展趋势。首先先分享几个初步结论:

1.从高精地图、激光雷达到BEV:自动驾驶的进化一切路径都是为了“让车的行为更像人”。

2.过去3年也是自动驾驶技术发展最快的3年,国内外大批玩家都已实现了不同程度的端到端,展望未来,最终达到整体端到端的终极形态也只是时间问题。

3.无论是纯视觉还是激光雷达路线,毫米波雷达都是弥补两者技术短板最好的手段,随着毫米波雷达从3D到4D再到成像毫米波雷达,不断提升的精度也让这个赛道拥有了诞生高价值公司的机会。

4. 自动驾驶的落地和商业化可能只是个开始,未来更多的赛道和产品(比如不同场景的机器人)在积累足够的数据之后,都可能复现类似的故事。

5. 纵观历史,每一次技术路线的迭代,都有一批创业公司崛起的机会,相信这次也不例外。


为什么说过去3年,是自动驾驶发展最快的3年?

自动驾驶公认的起源是2004年,当时的美国正深陷阿富汗和伊拉克的战争泥潭,急需一批军用无人载具来减少美军的伤亡,但研发进度始终不理想。

于是,时任美国国防部高级研究计划局(DARPA)局长托尼·特瑟突发奇想,搞出了一场挑战赛,宣布无论谁只要能用无人驾驶的方式,在10小时内从洛杉矶到达拉斯维加斯,就可以赢得100万美元奖金。

这实际上是一场美军针对民间的大型招标,主办方本来以为没什么人会参加,结果没想到有100多个团队报名,不过遗憾的是,最终没有一个人能拿走这笔奖金——因为最远的一辆参赛车也只行驶了12公里,约等于整个的赛程的5%。


(图:当时参赛的除了汽车,还有自动驾驶摩托车 ……

但DARPA并未放弃,又在2005-2007年连续举办了3届自动驾驶挑战赛,吸引了无数大学和企业的研究团队投入其中,这也让谷歌创始人之一的拉里佩奇看到了自动驾驶的潜力。

2009年,在佩奇的推动下,谷歌自动驾驶项目「Chauffeur」正式启动,招募的两位核心工程师(安东尼·莱万多夫斯基与塞巴斯蒂安·特龙)都曾是DARPA的参赛选手,这两个人后来也为了谷歌自动驾驶部门的开创者。

到2014年,谷歌发布了全球第一辆没有方向盘和油门踏板的全自动驾驶汽车Firefly,不仅震撼了汽车界,也让全世界首次意识到了自动驾驶实现的可能性。


(图: Google自研的第一代无人驾驶汽车Firefly)

紧跟着,大笔风险投资开始涌入无人驾驶赛道:从Uber、英伟达、亚马逊,到百度、滴滴、华为,再到奔驰、宝马、通用、本田,包括国内的造车新势力们,纷纷开始了对自动的驾驶研发的投入,今天我们耳熟能详自动驾驶公司也大多创立于那时。

时间很快来到2年之后,对自动驾驶的行业来说,2016是个极其重要的年份——因为这一年,特斯拉正式加入了战局。

不夸张的说, 以2016年为分界线,整个自动驾驶的下半场,就是一部特斯拉从一个行业追赶者,逐渐变成引领者的逆袭史, 所以个人觉得,怎样去渲染这个时点都不过分。

在2016年之前,几乎所有自动驾驶公司都选择了谷歌的技术方案:

1)定位:以高精度地图的辅助定位;

2)感知:用激光雷达+视觉摄像头为车辆提供感知信息;

3)规控:基于rule based算法做决策和控制。

不难发现,谷歌方案的底层逻辑是「叠甲」,所谓 “有总比没有好、多总比少好”。

这一派认为,以目前的技术水平,没有一个单一传感器能够完成自动驾驶所需的全部功能,或者说覆盖所有corner case,因此需要利用所有传感器来综合进行自动驾驶决策,给不同的传感器分配不同的权重;而这其中,激光雷达的权重又是最高的,所以这一派的解决方案也被称为 「激光雷达方案」 ;本质上,这是一条硬件为主的技术路线。

而作为AI起家的科技公司,特斯拉则更看重软件,比如马斯克就觉得当时的激光雷达太贵了,要8万美元一个,所以他把更多的精力放在研发强大的视觉算法及专用AI芯片,试图借助摄像头对周边物体建立模型,并把数据添加至神经网络进行计算,慢慢发展出了 「纯视觉方案」 这条偏软件的技术路径。

用马斯克自己的话说,“人和动物都长眼睛,而不是雷达“,命运的齿轮也由此开始转动。

在当时来看,两条技术路线各有千秋:激光雷达虽然硬件成本高,但天生精度高、且具备深度信息(直到今天,很多工程师依然对激光雷达情有独钟);而摄像头虽然便宜,但分辨能力有限,只能在二维世界里通过物体一个面的信息努力做对照,通过计算与转化得来的情报总归不如一手信息来得准确和直观。

这也导致特斯拉一度自建了上千人的标注团队,所以当时很多人就质疑马斯克,说你硬件虽然便宜了,但综合成本算下来还不如激光雷达。

其实从这里也能看出,当时整个自动驾驶的AI程度几乎等于没有(除了lidar稍微有一些ai算法), 属于典型的“有多少人工,就有多少智能”, 如果AI的发展就此止步,那么特斯拉的纯视觉方案大概率也会遭遇瓶颈。

不过最终,拯救特斯拉的还是谷歌:

2019年,谷歌发表了那篇著名的Transformer论文(也是后来大模型的基础)。

虽然Transformer是一种基于注意力机制的神经网络模型,但特斯拉的工程师很快发现,Transformer不仅可以处理语言信息,也可以用于处理图像信息。

简言之,Transformer能够把特斯拉8个摄像头收集到的信息,融合到同一套定位坐标体系中, 相当于让汽车获得了“上帝视角”(即BEV,“鸟瞰图”), 能够看到周围环境的3D信息。


(图: BEV技术让特斯拉有了“上帝视角”)

2021年的AI day上,特斯拉发布并成功带火了BEV,从2022年下半年开始,国内玩家也纷纷宣布跟进,并逐渐开始实现BEV上车。

(所以说,虽然很多技术并非特斯拉原创,但它把前沿探索的先进理论工程化并实际落地应用的能力,绝对是宇宙级别。)

与此同时,特斯拉也开始尝试将标注过程尽可能自动化,来解决成本太高的问题。

它的原理有点像玩猜字谜:首先,车载摄像头在看到某个物体后(比如一棵树),会把信息上传到云端的大模型,然后由大模型来“猜”这个物体是什么?如果猜测的结果与8个传感器的呈现一致,那么这棵树就将被自动标注。

如此一来,特斯拉就摆脱了人力的限制,只要车辆能不断发回路面信息,它就能够无限量地训练自己的算法。

到此为止,特斯拉的表现已经足够惊艳,但仅仅一年之后,马斯克又在 AI day上放了两个大招,第一是引入了时空序列,第二是引入了占用网络。

简单来说, 前者让汽车拥有了对于时间的记忆能力 ,后者则实现了类似「伪激光雷达」的效果, 让汽车在不识别该物体是什么的情况下计算空间位置并判断是否需要进行避障,解决了之前“撞上白色大货车”的问题。

至此,不论路径单从效果而言,视觉方案已经达到了与雷达方案基本一样的效果。 BEV+Transformer成功实现了自动驾驶感知技术的路径收敛,也形成了今天视觉感知算法的基础框架。


(图:占用网络实现了类似「伪激光雷达」的效果)

所以大趋势上, 自动驾驶的进化路径其实是非常清晰的:一切目的都是为了让车的行为更像人, 让AI可以通过前面发生过什么,预测未来将会发生什么。

从这个角度来看,过去3年其实也是自动驾驶技术发展最快的3年,而AI也在自动驾驶里逐渐展现出强大的升级迭代能力;但当时的普通人大多对此了解不深,以为自动驾驶没什么进展。

真正让大众意识到AI对自动驾驶行业产生革命性影响的,还是2023年发生的几件事:

·马斯克首次在社交平台上提到“v12 is reserved for when FSD is end-to-end AI”让端到端出现在大众视野中(16年英伟达就提出过但影响力不大),无数人开始期待v12的发布;

·CVPR近十年来首次将best paper颁发给一个中国团队、褒奖其在实现端到端自动驾驶上做出的贡献;

·马斯克坐着一辆搭载了v12测试版的model S做了一次45分钟直播、全程仅干预一次,效果可以说非常不错。

不过也需要明确的是,目前尚无任何直接证据证明特斯拉展示的v12实现了完全的端到端,只是其展示的效果确实非常惊艳,智能化程度基本可以与人类老司机媲美。

事实上,如果将自动驾驶系统按传统的理解分为感知、规划和控制, 目前各大主机厂用于秀肌肉的主要还是部分AI+基础规则约束的模块化端到端。







请到「今天看啥」查看全文