专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
相关文章推荐
51好读  ›  专栏  ›  量子位

对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025

量子位  · 公众号  · AI  · 2025-03-21 14:37

正文

一凡 发自 凹非寺
量子位 | 公众号 QbitAI

自动驾驶实现垂直领域的AGI,有了新路径。

不是Robotaxi ,而是 RoadAGI

在英伟达GTC 2025上,元戎启行CEO 周光 受邀分享, 提出用RoadAGI,能更快大规模商用自动驾驶,实现垂直道路场景下的AGI ,RoadAGI的实施平台,是元戎最新分享的 AI Spark

不借助高精地图 ,一个平台赋能智能车、机器人甚至小电驴……总之,一切可动的移动体,都将具有自主移动的意识。

这是一条通过自动驾驶实现AGI的新途径。

元戎启行和CEO周光,代表AI公司、自动驾驶公司,开辟起了第二种可能性。

所以RoadAGI究竟是什么?

用RoadAGI迈向AGI

先说人人可感知的场景——

你下一次点的外卖,可能是这样的:

赛博“外卖小哥”, 全程不用高精地图 ,自动识别店铺:

拿到商品后,一溜小跑到路口,自主识别到红绿灯:

然后一停二看三通过:

它还能进到楼里,自己过闸机、摁电梯:

然后到电梯里,再自己摁楼层:

出电梯直接给你送到公司前台:

整个过程,是不是跟咱们人一样?

你也可以让它把商品放外卖柜里:

这就是元戎启行在 英伟达GTC 2025 上,分享的 物理AI 最新进展:
RoadAGI

用一套AI底座,解决路上的所有移动体,实现垂直道路场景下的AGI

前面展示的是RoadAGI落地的第一个形态 Spark 1.0 看着很像无人配送车,但是据了解有本质不同

首先,技术上,其移动不依赖高精地图,在导航的指引下,自主识别周边环境信息,就能实现 “门到门” 位移。

为什么不需要扫图?

因为元戎把技术底座VLA走通了

VLA,即视觉语言动作模型,是端到端的最新成果,预计今年年中量产上车。

新范式已得到了行业头部的响应,比如理想汽车,隐隐成为行业共识。

VLA用一个多模态模型,统一过去的视觉语言模型和端到端, 将道路图像信息和文本指示融合处理 ,输出驾驶行为和文字。

这意味着, VLA打通了空间智能、语言智能和行为智能

因此,VLA加持的移动体,改善了配送体验。

以往的无人配送,只是负责配送的一个环节,只能做到“楼到楼”。你买个东西,还要自己下楼取。

现在不一样了,直接实现“门到门”,整个配送流程闭环了。

但问题是,元戎启行作为端到端智驾的代表性公司,智能驾驶领域的竞速正在如火如荼,怎么就此时此刻开辟起第二曲线来了?

围绕最新战略, 量子位 进一步与 周光 展开了对话。

周光说,根本上是因为 元戎从不将自己当作智驾公司,而是一家AI公司

智驾只不过是实现物理AI的商业化选择 ,元戎已取得了不错的进展:

在国内最早摆脱高精地图依赖,率先转向端到端,去年首个量产车型上市后成为爆款,凭借单款车型获取了城区NOA市场 15% 的份额。

智驾爆款让元戎的数据飞轮加速转动。

经过4000万公里的智驾数据积累后,元戎的AI能力更加通用,是时候向上走,实现RoadAGI,向物理AI再迈一步了。

周光认为, RoadAGI的出现一定早于L5 ,不过这还不算实现物理AI,只是解决了道路场景。

而当实现物理AI,并将其与生成式AI和语言AI打通时,真正的AGI就到来了

以下为对话实录整理, 内容较长,可参考目录阅读:

- 阅读指引
1. 谈RoadAGI:与无人配送本质不同
2. 谈时间点:RoadAGI,为什么是现在?
3. 谈影响:RoadAGI对元戎的影响和目标?
4. 谈AGI:先RoadAGI,然后Physical AI,最终实现AGI
5. 谈DeepSeek:中国的奇迹,让全球重估中国资产
6. 谈FSD入华:领先国内一代,只是数据“水土不服”
7. 谈智驾行业:AI越强大,越不需Lidar
8. 谈技术的选择:选择比努力重要

谈RoadAGI:与无人配送本质不同

量子位:如何理解RoadAGI?

周光 :RoadAGI实际上是 基于AI的通勤能力 。类似你出门上班,离开家到公司,从头到尾只用腿,很少用手。

就像“外卖小哥”一样,RoadAGI,或者说Spark 1.0可以实现 配送的闭环 :从店里拿到东西,然后用“小电驴”到另外一个地方,再把东西投递到目的地。

量子位:这和过去的 人配送车 有什么区别?

周光: 我觉得 技术层面上 本质 的不同。

我们是基于AI的,以前是基于高精地图。这意味着, RoadAGI是免部署的 。举个例子来说, 我要到你的办公室,你告诉我你的办公室在海淀的哪栋楼,哪个房间。

只要人能找到你的办公室,那么我们的RoadAGI智能体也应该可以

当然如果说这个小区特别破旧,连字都没有,需要问路,AI Spark可能目前还找不到。但只要是通过人观察就能找到的地方,AI Spark就能通过推理,实现点到点的通勤。

而不是说基于高精地图,那是不现实的,这又不是酒店机器人。

我觉得今天的L4其实挺像酒店机器人

量子位:你们打算怎么实现RoadAGI,会软硬件全栈自研吗?

周光 :没有。我们只做高等级的规划, 把机器人看作一辆车 。我们不是说做一个能走的机器人, 我们是机器人能走后,告诉他该怎么走

比如像霍金,他不会走,但是他通过他的轮椅遥感,他知道该怎么走。

我们给的是一个高级的AI能力,而不是说腿能走的能力

各家公司有各自的做法,做机器人的公司有很多积累,他们走得很好,甚至能跳能跑了。所以我们没有必要去做。我们替代的是控制无人机的飞手,替代的是机器人后面拿遥控器的人, 我们的目的是实现真正的自动化

量子位:实现RoadAGI的关键是什么?

周光 :就像外卖小哥去一个地方,当他骑上小电驴的时候,这跟自动驾驶没有什么区别。

当他停好外卖车, 接下来这部分跟自动驾驶就有区别了

他下了小电驴,要去商场或者小区送东西,这就比较复杂了,这个场景我觉得需要通过AI Spark平台去解决。就像外卖小哥,甚至还要跑到每个楼的犄角旮旯里。

量子位:相当于外卖小哥下了车,就是一个新的场景?

周光 :不是。我只是说解决这个场景,不能靠建高精度地图。

谈时间点:RoadAGI,为什么是现在?

量子位:RoadAGI,为什么是现在?是因为看到物理AI的浪潮和机会吗?

周光: 其实去年GT C大会的时候,我们就想要做物理AI了

周光在英伟达GTC 2024

端到端出来后, VLA这条路逐渐走通了 ,那我觉得这个时候去做RoadAGI是比较正常的。

现在的一些机器人都是基于规则的,做一些低阶的控制,比如挥个手,跳一支舞。 那些其实说实话不能叫物理AI,它只能叫一个动作 ,今天可以通过学习做一个更长的动作。但是它不具备这个自主的行为能力。

量子位:做RoadAGI是出于投融资的考量吗?

周光 :不是。我只是觉得我们应该去做这项技术,不是为了取悦投资者,就像过去我们率先做无图NOA,转向端到端。

我们一直不是为了取悦投资者去讲故事。我们只是觉得端到端、VLA这些技术出现后,不仅仅可以应用于自动驾驶。

量子位:做RoadAGI和具身智能的火热有关吗?

周光 RoadAGI和具身智能根本不冲突 ,我们做的是规划和大脑。

量子位:为什么将RoadAGI称之为元戎战略的延伸?

周光 我们是个AI公司 ,AI本身就要做各个方面。端到端出来后,我们自然而然想到可以做机器人。

机器人需要高等级的智能,去做更高等级的规划,而不只是扫个图、能跑能动。我们的目的是用技术解决智能体的移动问题,像我们人,我觉得最重要的是手。

除了手之外,我们人应该是想去哪里都能去。人出门就用各种导航,进到小区,我们自己会观察,自己会看,走到目的地,然后再去做手上的事儿。

我认为RoadAGI是我们的能力延伸,而且是成熟的技术的延伸

量子位:元戎做RoadAGI有什么优势?

周光 我们的优势是,我们把智能驾驶跑通了。 我们之所以没有去做手,是因为 做手跟我们的RoadAGI还是有区别的

RoadAGI跟我们目前做的端到端自动驾驶,我觉得是高度近似的 ,可能也就是数据闭环上有一些变化。

这也是做RoadAGI的一个原因: 技术的相似

另外一个原因是 商业化 。我认为RoadAGI最快的商业化落地形态其实就是“外卖小哥”。

今天点到点的无人配送,有很多都需要依赖扫图,我认为商业价值比较受限,因为图很难穷尽。

我认为更有商业价值的就是RoadAGI。像今天自动驾驶的MPCI (Miles Per Critical Intervention) ,大家都能做到百公里级, 这意味着两个小时出现一次安全接管 。这在很多场景其实已经可大规模商业化了,比如洗碗。

我认为, L5级自动驾驶难以实现就在于它的容错率太低了 。而RoadAGI大量的场景其实是有容错的, 所以商业化会来得更快。

量子位:为什么不等市场更成熟了再去做?

周光 :就和当初为什么我们要做无图一样,想做好自动驾驶就需要先做好RoadAGI。

量子位:这不是一个成熟后再去做的事情,而是现在智驾需要这方面的能力?

周光 :对,我认为智驾是需要具备RoadAGI能力的。

谈影响:RoadAGI对元戎的影响和目标?

量子位:对于初战告捷的智驾业务,RoadAGI战略或者说AI Spark平台会分散兵力吗?

周光 :不会。为什么我们不去做手?如果是去做手肯定会分散兵力,因为技术栈不一样。

我们的AI Spark平台跟智驾其实是高度一致的,只是数据不一样而已。就像人走路用步行导航,驾驶用开车导航。这个相似度太高了,只需要换数据集。到了一个小区内部,就是泊车的场景。

量子位:RoadAGI形成的技术壁垒是什么?

周光 :在物理AI领域,我相信目前大家都还不具备像我们这样 大规模量产的数据闭环能力, 端到端的能力 。我觉得现在可能没有竞争对手。现在那些所谓对手,技术选择跟我们不一样,主要基于高精地图。

我们不认为他们是竞争对手,就像ChatGPT和Siri不会是竞争对手。

量子位:做RoadAGI有什么商业化目标?

周光 :目前最先落地的一个场景是送外卖,先跑起来。我觉得这个成本更便宜, 用汽车的供应链, 硬件成本可能也就一两万块 ,就能实现点到点的移动,前景广阔。

量子位:做自动驾驶是把司机从驾驶位拿下去,RoadAGI是把外卖小哥从驾驶位拿下去。

周光 :也不是。不光是将小哥从车上拿下去,因为外卖小哥下车后还要跑,RoadAGI也要跑通下车后的这段路。

量子位:相比过去的无人配送还需要人去拿,RoadAGI现在做了一个闭环,为什么会这样?

周光 :因为技术成熟了。就好像AI游戏创业,ChatGPT出来之前,没人会去变革游戏中的NPC,因为以前技术不成熟,做不了。

今天有了端到端,加上机械手臂,可以做到一些复杂任务。 如果不是技术成熟了,今天还要靠扫高精地图的话,我就不去做RoadAGI了

量子位:为什么说现在技术成熟了?

周光 :因为VLA逐渐开始成熟,让RoadAGI可持续了。我们2023年就想做(RoadAGI),但是当时端到端还没做出来,就先不去想别的。

量子位:现在可以说VLA高度成熟了吗?

周光 :现在还没有。就好比端到端,我们从来都没有去纠结过什么叫两段式,什么叫一段式,我们不参与这种讨论。我们是家 AI 公司,我们不是一个纯智驾公司。

我们的愿景其实还是做物理AI 。我觉得这也需要产业链的,希望不是只有我们一个人做。我的逻辑很清晰,人的移动能力,跟车子高度相关。







请到「今天看啥」查看全文