专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

对话周光：自动驾驶实现AGI，RoadAGI比L5更快 | GTC 2025

量子位 · 公众号 · AI · 2025-03-21 14:37

正文

一凡发自凹非寺
量子位 | 公众号 QbitAI

自动驾驶实现垂直领域的AGI，有了新路径。

不是Robotaxi ，而是 RoadAGI 。

在英伟达GTC 2025上，元戎启行CEO 周光受邀分享， 提出用RoadAGI，能更快大规模商用自动驾驶，实现垂直道路场景下的AGI ，RoadAGI的实施平台，是元戎最新分享的 AI Spark ：

不借助高精地图 ，一个平台赋能智能车、机器人甚至小电驴……总之，一切可动的移动体，都将具有自主移动的意识。

这是一条通过自动驾驶实现AGI的新途径。

元戎启行和CEO周光，代表AI公司、自动驾驶公司，开辟起了第二种可能性。

所以RoadAGI究竟是什么？

用RoadAGI迈向AGI

先说人人可感知的场景——

你下一次点的外卖，可能是这样的：

赛博“外卖小哥”， 全程不用高精地图 ，自动识别店铺：

拿到商品后，一溜小跑到路口，自主识别到红绿灯：

然后一停二看三通过：

它还能进到楼里，自己过闸机、摁电梯：

然后到电梯里，再自己摁楼层：

出电梯直接给你送到公司前台：

整个过程，是不是跟咱们人一样？

你也可以让它把商品放外卖柜里：

这就是元戎启行在 英伟达GTC 2025 上，分享的 物理AI 最新进展：
RoadAGI 。

用一套AI底座，解决路上的所有移动体，实现垂直道路场景下的AGI 。

前面展示的是RoadAGI落地的第一个形态 Spark 1.0 ， 看着很像无人配送车，但是据了解有本质不同 。

首先，技术上，其移动不依赖高精地图，在导航的指引下，自主识别周边环境信息，就能实现 “门到门” 位移。

为什么不需要扫图？

因为元戎把技术底座VLA走通了 。

VLA，即视觉语言动作模型，是端到端的最新成果，预计今年年中量产上车。

新范式已得到了行业头部的响应，比如理想汽车，隐隐成为行业共识。

VLA用一个多模态模型，统一过去的视觉语言模型和端到端， 将道路图像信息和文本指示融合处理 ，输出驾驶行为和文字。

这意味着， VLA打通了空间智能、语言智能和行为智能 。

因此，VLA加持的移动体，改善了配送体验。

以往的无人配送，只是负责配送的一个环节，只能做到“楼到楼”。你买个东西，还要自己下楼取。

现在不一样了，直接实现“门到门”，整个配送流程闭环了。

但问题是，元戎启行作为端到端智驾的代表性公司，智能驾驶领域的竞速正在如火如荼，怎么就此时此刻开辟起第二曲线来了？

围绕最新战略， 量子位 进一步与周光展开了对话。

周光说，根本上是因为 元戎从不将自己当作智驾公司，而是一家AI公司 。

智驾只不过是实现物理AI的商业化选择 ，元戎已取得了不错的进展：

在国内最早摆脱高精地图依赖，率先转向端到端，去年首个量产车型上市后成为爆款，凭借单款车型获取了城区NOA市场 15% 的份额。

智驾爆款让元戎的数据飞轮加速转动。

经过4000万公里的智驾数据积累后，元戎的AI能力更加通用，是时候向上走，实现RoadAGI，向物理AI再迈一步了。

周光认为， RoadAGI的出现一定早于L5 ，不过这还不算实现物理AI，只是解决了道路场景。

而当实现物理AI，并将其与生成式AI和语言AI打通时，真正的AGI就到来了 。

以下为对话实录整理，内容较长，可参考目录阅读：

- 阅读指引
1. 谈RoadAGI：与无人配送本质不同
2. 谈时间点：RoadAGI，为什么是现在？
3. 谈影响：RoadAGI对元戎的影响和目标？
4. 谈AGI：先RoadAGI，然后Physical AI，最终实现AGI
5. 谈DeepSeek：中国的奇迹，让全球重估中国资产
6. 谈FSD入华：领先国内一代，只是数据“水土不服”
7. 谈智驾行业：AI越强大，越不需Lidar
8. 谈技术的选择：选择比努力重要

谈RoadAGI：与无人配送本质不同

量子位：如何理解RoadAGI？

周光：RoadAGI实际上是 基于AI的通勤能力 。类似你出门上班，离开家到公司，从头到尾只用腿，很少用手。

就像“外卖小哥”一样，RoadAGI，或者说Spark 1.0可以实现 配送的闭环 ：从店里拿到东西，然后用“小电驴”到另外一个地方，再把东西投递到目的地。

量子位：这和过去的 无 人配送车 有什么区别？

周光： 我觉得 技术层面上 有本质的不同。

我们是基于AI的，以前是基于高精地图。这意味着， RoadAGI是免部署的 。举个例子来说，我要到你的办公室，你告诉我你的办公室在海淀的哪栋楼，哪个房间。

只要人能找到你的办公室，那么我们的RoadAGI智能体也应该可以 。

当然如果说这个小区特别破旧，连字都没有，需要问路，AI Spark可能目前还找不到。但只要是通过人观察就能找到的地方，AI Spark就能通过推理，实现点到点的通勤。

而不是说基于高精地图，那是不现实的，这又不是酒店机器人。

我觉得今天的L4其实挺像酒店机器人 。

量子位：你们打算怎么实现RoadAGI，会软硬件全栈自研吗？

周光：没有。我们只做高等级的规划， 把机器人看作一辆车 。我们不是说做一个能走的机器人， 我们是机器人能走后，告诉他该怎么走 。

比如像霍金，他不会走，但是他通过他的轮椅遥感，他知道该怎么走。

我们给的是一个高级的AI能力，而不是说腿能走的能力 。

各家公司有各自的做法，做机器人的公司有很多积累，他们走得很好，甚至能跳能跑了。所以我们没有必要去做。我们替代的是控制无人机的飞手，替代的是机器人后面拿遥控器的人， 我们的目的是实现真正的自动化 。

量子位：实现RoadAGI的关键是什么？

周光：就像外卖小哥去一个地方，当他骑上小电驴的时候，这跟自动驾驶没有什么区别。

当他停好外卖车， 接下来这部分跟自动驾驶就有区别了 。

他下了小电驴，要去商场或者小区送东西，这就比较复杂了，这个场景我觉得需要通过AI Spark平台去解决。就像外卖小哥，甚至还要跑到每个楼的犄角旮旯里。

量子位：相当于外卖小哥下了车，就是一个新的场景？

周光：不是。我只是说解决这个场景，不能靠建高精度地图。

谈时间点：RoadAGI，为什么是现在？

量子位：RoadAGI，为什么是现在？是因为看到物理AI的浪潮和机会吗？

周光： 其实去年GT C大会的时候，我们就想要做物理AI了 。

△ 周光在英伟达GTC 2024

端到端出来后， VLA这条路逐渐走通了 ，那我觉得这个时候去做RoadAGI是比较正常的。

现在的一些机器人都是基于规则的，做一些低阶的控制，比如挥个手，跳一支舞。 那些其实说实话不能叫物理AI，它只能叫一个动作 ，今天可以通过学习做一个更长的动作。但是它不具备这个自主的行为能力。

量子位：做RoadAGI是出于投融资的考量吗？

周光：不是。我只是觉得我们应该去做这项技术，不是为了取悦投资者，就像过去我们率先做无图NOA，转向端到端。

我们一直不是为了取悦投资者去讲故事。我们只是觉得端到端、VLA这些技术出现后，不仅仅可以应用于自动驾驶。

量子位：做RoadAGI和具身智能的火热有关吗？

周光： RoadAGI和具身智能根本不冲突 ，我们做的是规划和大脑。

量子位：为什么将RoadAGI称之为元戎战略的延伸？

周光： 我们是个AI公司 ，AI本身就要做各个方面。端到端出来后，我们自然而然想到可以做机器人。

机器人需要高等级的智能，去做更高等级的规划，而不只是扫个图、能跑能动。我们的目的是用技术解决智能体的移动问题，像我们人，我觉得最重要的是手。

除了手之外，我们人应该是想去哪里都能去。人出门就用各种导航，进到小区，我们自己会观察，自己会看，走到目的地，然后再去做手上的事儿。

我认为RoadAGI是我们的能力延伸，而且是成熟的技术的延伸 。

量子位：元戎做RoadAGI有什么优势？

周光：我们的优势是，我们把智能驾驶跑通了。我们之所以没有去做手，是因为 做手跟我们的RoadAGI还是有区别的 。

RoadAGI跟我们目前做的端到端自动驾驶，我觉得是高度近似的 ，可能也就是数据闭环上有一些变化。

这也是做RoadAGI的一个原因： 技术的相似 。

另外一个原因是 商业化 。我认为RoadAGI最快的商业化落地形态其实就是“外卖小哥”。

今天点到点的无人配送，有很多都需要依赖扫图，我认为商业价值比较受限，因为图很难穷尽。

我认为更有商业价值的就是RoadAGI。像今天自动驾驶的MPCI (Miles Per Critical Intervention) ，大家都能做到百公里级， 这意味着两个小时出现一次安全接管 。这在很多场景其实已经可大规模商业化了，比如洗碗。

我认为， L5级自动驾驶难以实现就在于它的容错率太低了 。而RoadAGI大量的场景其实是有容错的，所以商业化会来得更快。

量子位：为什么不等市场更成熟了再去做？

周光：就和当初为什么我们要做无图一样，想做好自动驾驶就需要先做好RoadAGI。

量子位：这不是一个成熟后再去做的事情，而是现在智驾需要这方面的能力？

周光：对，我认为智驾是需要具备RoadAGI能力的。

谈影响：RoadAGI对元戎的影响和目标？

量子位：对于初战告捷的智驾业务，RoadAGI战略或者说AI Spark平台会分散兵力吗？

周光：不会。为什么我们不去做手？如果是去做手肯定会分散兵力，因为技术栈不一样。

我们的AI Spark平台跟智驾其实是高度一致的，只是数据不一样而已。就像人走路用步行导航，驾驶用开车导航。这个相似度太高了，只需要换数据集。到了一个小区内部，就是泊车的场景。

量子位：RoadAGI形成的技术壁垒是什么？

周光：在物理AI领域，我相信目前大家都还不具备像我们这样 大规模量产的数据闭环能力，端到端的能力 。我觉得现在可能没有竞争对手。现在那些所谓对手，技术选择跟我们不一样，主要基于高精地图。

我们不认为他们是竞争对手，就像ChatGPT和Siri不会是竞争对手。

量子位：做RoadAGI有什么商业化目标？

周光：目前最先落地的一个场景是送外卖，先跑起来。我觉得这个成本更便宜，用汽车的供应链， 硬件成本可能也就一两万块 ，就能实现点到点的移动，前景广阔。

量子位：做自动驾驶是把司机从驾驶位拿下去，RoadAGI是把外卖小哥从驾驶位拿下去。

周光：也不是。不光是将小哥从车上拿下去，因为外卖小哥下车后还要跑，RoadAGI也要跑通下车后的这段路。

量子位：相比过去的无人配送还需要人去拿，RoadAGI现在做了一个闭环，为什么会这样？

周光：因为技术成熟了。就好像AI游戏创业，ChatGPT出来之前，没人会去变革游戏中的NPC，因为以前技术不成熟，做不了。

今天有了端到端，加上机械手臂，可以做到一些复杂任务。 如果不是技术成熟了，今天还要靠扫高精地图的话，我就不去做RoadAGI了 。

量子位：为什么说现在技术成熟了？

周光：因为VLA逐渐开始成熟，让RoadAGI可持续了。我们2023年就想做（RoadAGI），但是当时端到端还没做出来，就先不去想别的。

量子位：现在可以说VLA高度成熟了吗？

周光：现在还没有。就好比端到端，我们从来都没有去纠结过什么叫两段式，什么叫一段式，我们不参与这种讨论。我们是家 AI 公司，我们不是一个纯智驾公司。

我们的愿景其实还是做物理AI 。我觉得这也需要产业链的，希望不是只有我们一个人做。我的逻辑很清晰，人的移动能力，跟车子高度相关。