一凡 发自 凹非寺
量子位 | 公众号 QbitAI
自动驾驶实现垂直领域的AGI,有了新路径。
不是Robotaxi
,而是
RoadAGI
。
在英伟达GTC 2025上,元戎启行CEO
周光
受邀分享,
提出用RoadAGI,能更快大规模商用自动驾驶,实现垂直道路场景下的AGI
,RoadAGI的实施平台,是元戎最新分享的
AI Spark
:
不借助高精地图
,一个平台赋能智能车、机器人甚至小电驴……总之,一切可动的移动体,都将具有自主移动的意识。
这是一条通过自动驾驶实现AGI的新途径。
元戎启行和CEO周光,代表AI公司、自动驾驶公司,开辟起了第二种可能性。
所以RoadAGI究竟是什么?
用RoadAGI迈向AGI
先说人人可感知的场景——
你下一次点的外卖,可能是这样的:
赛博“外卖小哥”,
全程不用高精地图
,自动识别店铺:
拿到商品后,一溜小跑到路口,自主识别到红绿灯:
然后一停二看三通过:
它还能进到楼里,自己过闸机、摁电梯:
然后到电梯里,再自己摁楼层:
出电梯直接给你送到公司前台:
整个过程,是不是跟咱们人一样?
你也可以让它把商品放外卖柜里:
这就是元戎启行在
英伟达GTC 2025
上,分享的
物理AI
最新进展:
RoadAGI
。
用一套AI底座,解决路上的所有移动体,实现垂直道路场景下的AGI
。
前面展示的是RoadAGI落地的第一个形态
Spark 1.0
,
看着很像无人配送车,但是据了解有本质不同
。
首先,技术上,其移动不依赖高精地图,在导航的指引下,自主识别周边环境信息,就能实现
“门到门”
位移。
为什么不需要扫图?
因为元戎把技术底座VLA走通了
。
VLA,即视觉语言动作模型,是端到端的最新成果,预计今年年中量产上车。
新范式已得到了行业头部的响应,比如理想汽车,隐隐成为行业共识。
VLA用一个多模态模型,统一过去的视觉语言模型和端到端,
将道路图像信息和文本指示融合处理
,输出驾驶行为和文字。
这意味着,
VLA打通了空间智能、语言智能和行为智能
。
因此,VLA加持的移动体,改善了配送体验。
以往的无人配送,只是负责配送的一个环节,只能做到“楼到楼”。你买个东西,还要自己下楼取。
现在不一样了,直接实现“门到门”,整个配送流程闭环了。
但问题是,元戎启行作为端到端智驾的代表性公司,智能驾驶领域的竞速正在如火如荼,怎么就此时此刻开辟起第二曲线来了?
围绕最新战略,
量子位
进一步与
周光
展开了对话。
周光说,根本上是因为
元戎从不将自己当作智驾公司,而是一家AI公司
。
智驾只不过是实现物理AI的商业化选择
,元戎已取得了不错的进展:
在国内最早摆脱高精地图依赖,率先转向端到端,去年首个量产车型上市后成为爆款,凭借单款车型获取了城区NOA市场
15%
的份额。
智驾爆款让元戎的数据飞轮加速转动。
经过4000万公里的智驾数据积累后,元戎的AI能力更加通用,是时候向上走,实现RoadAGI,向物理AI再迈一步了。
周光认为,
RoadAGI的出现一定早于L5
,不过这还不算实现物理AI,只是解决了道路场景。
而当实现物理AI,并将其与生成式AI和语言AI打通时,真正的AGI就到来了
。
以下为对话实录整理,
内容较长,可参考目录阅读:
- 阅读指引
1. 谈RoadAGI:与无人配送本质不同
2. 谈时间点:RoadAGI,为什么是现在?
3. 谈影响:RoadAGI对元戎的影响和目标?
4. 谈AGI:先RoadAGI,然后Physical AI,最终实现AGI
5. 谈DeepSeek:中国的奇迹,让全球重估中国资产
6. 谈FSD入华:领先国内一代,只是数据“水土不服”
7. 谈智驾行业:AI越强大,越不需Lidar
8. 谈技术的选择:选择比努力重要
谈RoadAGI:与无人配送本质不同
量子位:如何理解RoadAGI?
周光
:RoadAGI实际上是
基于AI的通勤能力
。类似你出门上班,离开家到公司,从头到尾只用腿,很少用手。
就像“外卖小哥”一样,RoadAGI,或者说Spark 1.0可以实现
配送的闭环
:从店里拿到东西,然后用“小电驴”到另外一个地方,再把东西投递到目的地。
量子位:这和过去的
无
人配送车
有什么区别?
周光:
我觉得
技术层面上
有
本质
的不同。
我们是基于AI的,以前是基于高精地图。这意味着,
RoadAGI是免部署的
。举个例子来说, 我要到你的办公室,你告诉我你的办公室在海淀的哪栋楼,哪个房间。
只要人能找到你的办公室,那么我们的RoadAGI智能体也应该可以
。
当然如果说这个小区特别破旧,连字都没有,需要问路,AI Spark可能目前还找不到。但只要是通过人观察就能找到的地方,AI Spark就能通过推理,实现点到点的通勤。
而不是说基于高精地图,那是不现实的,这又不是酒店机器人。
我觉得今天的L4其实挺像酒店机器人
。
量子位:你们打算怎么实现RoadAGI,会软硬件全栈自研吗?
周光
:没有。我们只做高等级的规划,
把机器人看作一辆车
。我们不是说做一个能走的机器人,
我们是机器人能走后,告诉他该怎么走
。
比如像霍金,他不会走,但是他通过他的轮椅遥感,他知道该怎么走。
我们给的是一个高级的AI能力,而不是说腿能走的能力
。
各家公司有各自的做法,做机器人的公司有很多积累,他们走得很好,甚至能跳能跑了。所以我们没有必要去做。我们替代的是控制无人机的飞手,替代的是机器人后面拿遥控器的人,
我们的目的是实现真正的自动化
。
量子位:实现RoadAGI的关键是什么?
周光
:就像外卖小哥去一个地方,当他骑上小电驴的时候,这跟自动驾驶没有什么区别。
当他停好外卖车,
接下来这部分跟自动驾驶就有区别了
。
他下了小电驴,要去商场或者小区送东西,这就比较复杂了,这个场景我觉得需要通过AI Spark平台去解决。就像外卖小哥,甚至还要跑到每个楼的犄角旮旯里。
量子位:相当于外卖小哥下了车,就是一个新的场景?
周光
:不是。我只是说解决这个场景,不能靠建高精度地图。
谈时间点:RoadAGI,为什么是现在?
量子位:RoadAGI,为什么是现在?是因为看到物理AI的浪潮和机会吗?
周光:
其实去年GT
C大会的时候,我们就想要做物理AI了
。
△
周光在英伟达GTC 2024
端到端出来后,
VLA这条路逐渐走通了
,那我觉得这个时候去做RoadAGI是比较正常的。
现在的一些机器人都是基于规则的,做一些低阶的控制,比如挥个手,跳一支舞。
那些其实说实话不能叫物理AI,它只能叫一个动作
,今天可以通过学习做一个更长的动作。但是它不具备这个自主的行为能力。
量子位:做RoadAGI是出于投融资的考量吗?
周光
:不是。我只是觉得我们应该去做这项技术,不是为了取悦投资者,就像过去我们率先做无图NOA,转向端到端。
我们一直不是为了取悦投资者去讲故事。我们只是觉得端到端、VLA这些技术出现后,不仅仅可以应用于自动驾驶。
量子位:做RoadAGI和具身智能的火热有关吗?
周光
:
RoadAGI和具身智能根本不冲突
,我们做的是规划和大脑。
量子位:为什么将RoadAGI称之为元戎战略的延伸?
周光
:
我们是个AI公司
,AI本身就要做各个方面。端到端出来后,我们自然而然想到可以做机器人。
机器人需要高等级的智能,去做更高等级的规划,而不只是扫个图、能跑能动。我们的目的是用技术解决智能体的移动问题,像我们人,我觉得最重要的是手。
除了手之外,我们人应该是想去哪里都能去。人出门就用各种导航,进到小区,我们自己会观察,自己会看,走到目的地,然后再去做手上的事儿。
我认为RoadAGI是我们的能力延伸,而且是成熟的技术的延伸
。
量子位:元戎做RoadAGI有什么优势?
周光
:
我们的优势是,我们把智能驾驶跑通了。
我们之所以没有去做手,是因为
做手跟我们的RoadAGI还是有区别的
。
RoadAGI跟我们目前做的端到端自动驾驶,我觉得是高度近似的
,可能也就是数据闭环上有一些变化。
这也是做RoadAGI的一个原因:
技术的相似
。
另外一个原因是
商业化
。我认为RoadAGI最快的商业化落地形态其实就是“外卖小哥”。
今天点到点的无人配送,有很多都需要依赖扫图,我认为商业价值比较受限,因为图很难穷尽。
我认为更有商业价值的就是RoadAGI。像今天自动驾驶的MPCI
(Miles Per Critical Intervention)
,大家都能做到百公里级,
这意味着两个小时出现一次安全接管
。这在很多场景其实已经可大规模商业化了,比如洗碗。
我认为,
L5级自动驾驶难以实现就在于它的容错率太低了
。而RoadAGI大量的场景其实是有容错的, 所以商业化会来得更快。
量子位:为什么不等市场更成熟了再去做?
周光
:就和当初为什么我们要做无图一样,想做好自动驾驶就需要先做好RoadAGI。
量子位:这不是一个成熟后再去做的事情,而是现在智驾需要这方面的能力?
周光
:对,我认为智驾是需要具备RoadAGI能力的。
谈影响:RoadAGI对元戎的影响和目标?
量子位:对于初战告捷的智驾业务,RoadAGI战略或者说AI Spark平台会分散兵力吗?
周光
:不会。为什么我们不去做手?如果是去做手肯定会分散兵力,因为技术栈不一样。
我们的AI Spark平台跟智驾其实是高度一致的,只是数据不一样而已。就像人走路用步行导航,驾驶用开车导航。这个相似度太高了,只需要换数据集。到了一个小区内部,就是泊车的场景。
量子位:RoadAGI形成的技术壁垒是什么?
周光
:在物理AI领域,我相信目前大家都还不具备像我们这样
大规模量产的数据闭环能力, 端到端的能力
。我觉得现在可能没有竞争对手。现在那些所谓对手,技术选择跟我们不一样,主要基于高精地图。
我们不认为他们是竞争对手,就像ChatGPT和Siri不会是竞争对手。
量子位:做RoadAGI有什么商业化目标?
周光
:目前最先落地的一个场景是送外卖,先跑起来。我觉得这个成本更便宜, 用汽车的供应链,
硬件成本可能也就一两万块
,就能实现点到点的移动,前景广阔。
量子位:做自动驾驶是把司机从驾驶位拿下去,RoadAGI是把外卖小哥从驾驶位拿下去。
周光
:也不是。不光是将小哥从车上拿下去,因为外卖小哥下车后还要跑,RoadAGI也要跑通下车后的这段路。
量子位:相比过去的无人配送还需要人去拿,RoadAGI现在做了一个闭环,为什么会这样?
周光
:因为技术成熟了。就好像AI游戏创业,ChatGPT出来之前,没人会去变革游戏中的NPC,因为以前技术不成熟,做不了。
今天有了端到端,加上机械手臂,可以做到一些复杂任务。
如果不是技术成熟了,今天还要靠扫高精地图的话,我就不去做RoadAGI了
。
量子位:为什么说现在技术成熟了?
周光
:因为VLA逐渐开始成熟,让RoadAGI可持续了。我们2023年就想做(RoadAGI),但是当时端到端还没做出来,就先不去想别的。
量子位:现在可以说VLA高度成熟了吗?
周光
:现在还没有。就好比端到端,我们从来都没有去纠结过什么叫两段式,什么叫一段式,我们不参与这种讨论。我们是家 AI 公司,我们不是一个纯智驾公司。
我们的愿景其实还是做物理AI
。我觉得这也需要产业链的,希望不是只有我们一个人做。我的逻辑很清晰,人的移动能力,跟车子高度相关。