专栏名称: 36氪汽车
看懂汽车产业新百年。36氪旗下智能电动车产业报道公号。
目录
相关文章推荐
金融早实习  ·  天健会计师事务所2025春季校园招聘 ·  21 小时前  
金融早实习  ·  中信银行2025春季校园招聘! ·  昨天  
大道无形我有型  ·  你闭嘴吧!说得你比我还有钱似的。-20250 ... ·  昨天  
成都本地宝  ·  成都市中心新地标+1!最新进展→ ·  2 天前  
金融早实习  ·  联储证券2025届校园招聘 ·  2 天前  
51好读  ›  专栏  ›  36氪汽车

小鹏汽车李力耘:我们处于无人化前夜,智驾Scaling Law还有很大红利|36氪专访

36氪汽车  · 公众号  ·  · 2024-12-25 19:45

主要观点总结

本文是小鹏智驾负责人的访谈,介绍了小鹏智驾的演进历程、技术特点以及对未来的展望。小鹏智驾已经走过了从依赖高精地图到无图方案,再到端到端的转变。目前,小鹏智驾已经推出了AI鹰眼视觉方案,并计划在未来继续扩大其应用场景。在数据方面,小鹏智驾已经达成了2000万clips的训练数据,这得益于其AI智驾铁军和AI进展的提升。此外,小鹏智驾还计划在海外市场上发力,并根据当地驾驶习惯和法规提供符合当地用户需求的智驾体验。在考核方面,小鹏CEO何小鹏对智驾技术提出了拟人感、安全感、舒适和效率等方面的要求。

关键观点总结

关键观点1: 小鹏智驾的演进历程和技术特点

小鹏智驾从依赖高精地图到无图方案,再到端到端的转变。目前推出了AI鹰眼视觉方案,并计划扩大应用场景。

关键观点2: 小鹏智驾的数据成就

小鹏智驾达成了2000万clips的训练数据,这得益于AI智驾铁军和AI进展的提升。

关键观点3: 小鹏智驾的海外发展计划

小鹏智驾计划在海外市场上发力,根据当地驾驶习惯和法规提供符合当地用户需求的智驾体验。

关键观点4: 小鹏CEO对智驾技术的考核要求

何小鹏对智驾技术提出了拟人感、安全感、舒适和效率等方面的要求。


正文

「小鹏计划明年提供类无人驾驶能力」
| 李安琪 编辑 | 李勤


从美国试驾完特斯拉FSD回来,小鹏智能驾驶负责人李力耘有两大感受。其一是,特斯拉FSD在北美地区的确是独一档,但他也意识到,需要对特斯拉祛魅。
“中美路况非常不一样,我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强。”李力耘说。
角逐和较量在智驾圈里已经不新鲜。过去一年里,小鹏等车企迅速卷入了“全国都能开”“端到端”的智能驾驶竞争。
在今年12月末,小鹏还计划交付“车位到车位”智驾驾驶功能,技术模型也升级为“一段式端到端”,可 实现全场景覆盖,包括园区低速行驶,未来会覆盖泊车、高速场景,甚至海外智驾。
“车位到车位”是当下车企智能驾驶竞争的技术高地。如字面含义,车企希望用户在车位就能启动智驾,车辆低速巡航、自主过闸机、上高速,在城市道路通行,最后泊入目的车位。
12月初,特斯拉向部分测试用户推送的特斯拉FSD v13.2更新版本,就包含了从停车状态启动的FSD,也就是“车位到车位”功能。前不久理想汽车也宣布突出该功能,华为和小米汽车的类似功能,同样即将推出。
智能驾驶走向自动驾驶的过程不是一蹴而就,而是车企们通过技术攻坚,不断完成高速、城区、泊车、园区等场景拼图。如今,这一步即将完成。
李力耘也表示,现在小鹏处于“无人化(驾驶)前夜”,明年在能力上会有更大突破,“可能先在Max车型上,小鹏智驾逐步提供类似无人驾驶的能力。”
这几乎是最早给出无人驾驶节点的 国内 车企。
小鹏的确是国内最早贴上“智驾”标签的车企之一。2019年,小鹏就在轿跑车型P7上开发了高速NGP功能,对标特斯拉NOA。
但因为起步早,小鹏几乎走过所有技术路线,从依赖高精地图,转向无图方案,随后进化到端到端。2023年8月,小鹏智驾还经历了灵魂人物吴新宙离职、团队动荡等。小鹏智驾由此进入守城阶段。
同一时期,行业有玩家迅速进入了高阶智驾量产状态。比如压强式投入的华为,率先推出了“全国都能开”智驾功能;理想汽车则由于轻包袱,果断切入“端到端”技术,甚至直接更换到激进的“一段式端到端”方案。
从今年中以来,小鹏智驾试图回归与反击。
近日,小鹏智驾负责人李力耘接受了36氪的采访,他分享了小鹏如何将AI融入智驾,以及标配纯视觉智驾后,如何实现科技平权与商业闭环。
李力耘告诉36氪,小鹏对于端到端的研发始于2023年4月,当时主要是想用AI的认路能力,摆脱对高精地图的依赖。
结果小鹏发现,“一段式端到端”大模型上线之后,原来需要花很长时间打磨的场景,如特殊分流、右转或掉头等问题,很快就被解决了。
今年5月,小鹏正式推出“端到端”智驾大模型,包含神经网络XNet、规控大模型XPlanner、大语言模型XBrain三大部分。
端到端智驾依赖的核心资源之一就是数据,小鹏宣称,其端到端大模型训练数据量已经达到2000万clips。理想汽车也公开过其端到端的训练数据,目前大约在800万clips。
对于 2000万clips的数据起点 ,李力耘告诉36氪,这得益于过去基于规则的智驾经验积累,小鹏当前的数据采集和训练效率很高,例如通过车端规则经验实时标注,精准采集训练所需片段,从而针对目标场景进行精准密集训练。
他同时认为,在海量数据、不断提升的云端和车端算力下,自动驾驶的Scaling Law还有很大红利。
Scaling Law是大模型行业的一个定律,通常表示模型参数越大、数据集越大和计算资源增多,模型性能更好。
小鹏推出“端到端”大模型智驾方案的标志性成果,就是更果断摆脱对激光雷达的依赖,将纯视觉作为智驾技术路线。例如在新车P7+上,小鹏就标配了纯视觉智驾AI鹰眼方案。
但在行业中,未来数年的主流选择还是以视觉+激光雷达作为主要传感器。对此,李力耘向36氪汽车表示,走纯视觉路线其实是出于第一性原理。
在他看来,人们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人设计的, “人最重要的传感器是眼睛,所以纯视觉一定是最直接、最高效的解决方案。”
小鹏也宣称,其基于AI鹰眼的纯视觉方案,能做到比人眼视觉更好的效果,可以很好应对大光差、逆光场景。
在纯视觉智驾之路上,小鹏汽车决定走到底, 李力耘告诉36氪, 从P7+车型开始,不再有Max和Pro的版本区分,而是“全系标配Max,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案。”
这背后蕴含着一套清晰的智驾商业化策略,“我们会用一段式端到端放大我们的车型优势,不仅标配所有车型,更希望覆盖所有功能,实现点到点,包括赋能海外的智驾。”纯视觉智驾方案,无疑在成本上拥有先天优势。
实际上,凭借在同级车型中做出“智能差异化”的赛马策略,小鹏已经在两款新车 MONA M03和P7+上,尝到了甜头。
M03自9月上市以来连续3个月销量破万,P7+上市3小时也获得了超3万大定。这两款车的售价都在20万元以下,这个价格带是比亚迪等老牌车企的优势领域。
“智驾是小鹏P7+用户购车的 top 理由。”李力耘说,当下热销款 M03的泊车体验也与Max版智驾同级。
智能驾驶技术在车企的商业体系里已经越嵌越深,同时,也在承接整个AI技术的发展红利,快速迭代。这是资源和效率交织的产物。
李力 耘说, 如果把端到端的技术趋势看作智能驾驶驾领域的一场“工业革命”,能真正实现转型升级的企业其实是少数,大部分人还是会面临更残酷的竞争。
因为,端到端不是让事情变得更简单,而是让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源,包括更大算力,更加精英的AI研究人员。
“我更愿意相信是车企,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。”
以下是36氪汽车与小鹏智驾负责人李力耘的对话,内容略经编辑:
谈体验:“车位到车位”之争,用户会为更好的体验买单


36氪汽车:听说你刚从美国回来,有体验特斯拉的FSD v13吗?

李力耘: 但很遗憾,因为v13还没有量产推给用户,我没机会试FSD v13,但开了一个星期v12.5。有两点可以总结,第一是祛魅,第二特斯拉在北美是独一档的存在,很多值得学习的地方,包括停车场激活、开进停车场,这些是用户非常喜欢的功能。

去魅的话,我觉得中美路况非常不一样,无论是我们XNGP 5.4.0还是即将发布的5.5.0 版本,智驾都和特斯拉不相伯仲。我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强,我非常期待FSD进入中国之后的表现。

36氪汽车:行业会说特斯拉技术领先国内半年到一年,您觉得这种技术领先现在还有多少?

李力耘: 从技术方法论上,小鹏和特斯拉、OpenAI 这样的全球AI企业不谋而合,我们强调云端大模型,参数量是车端80倍以上。我们云端大模型的训练数据量达到2000 万以上clips。每个clips可以理解成大约一分钟的小电影。每个模型都基于大量数据、在云端训练。我们有个说法叫“云上一天,地上三五年”。

我们希望把云端能力通过蒸馏下放到不同芯片平台,甚至未来换芯片后也能把云端模型下放。

36氪汽车:您觉得特斯拉FSD v13上的“车位到车位”跟国内的“车位到车位”有区别吗?

李力耘: 我们即将推给用户的XOS 5.5.0版本上,用“一段式端到端”给用户提供了一个完整的“车位到车位”体验。其实在停车场和地库,2021 年我们就推出了VPA(记忆泊车)功能,但用户体验并不好,用户渗透率没有城区智驾那么高。

所以,我们用“一段式端到端”实现所有车型标配后,现在去实现全场景覆盖,包括“车位到车位”低速行驶、园区行驶,未来还会覆盖泊车、高速,甚至海外智驾。我们希望给用户带来更加连贯、丝滑的体验,而不是有割裂感、类似于VPA+NOA的组合体验。

36氪汽车:用户第一次开到新的地库,需要先记忆一遍才能实现点到点吗?

李力耘: 第一次肯定没有地图,很难,如果有园区内导航指引会好一些。就像你第一次去一个地库,也需要一些指引或者借助他人的记忆,我们可以做到无感学习和记忆。第二次去就可以有丝滑的“车位到车位”能力。

36氪汽车:小鹏之前也有记忆行车,比如记忆10条路线,这跟“车位到车位”的本质区别是什么?

李力耘: 最大区别还是体验层面。小鹏智驾在2024年最大的两个变化,第一是 AI化,面向AI进行组织变革,进行AI能力提升,另一个变化是,我们觉得用户不会为更好的科技买单,但一定会为更好的体验买单。

用端到端大模型赋能“车位到车位”后,用户体验会大大提升,虽然有时候可能需要学习、参考先验信息,但学习感会很弱。

谈AI:智驾Scaling Law还没到尽头


36氪汽车:今年智驾行业变化很大,年初卷“全国都能开”,后来变成端到端,现在是“车位到车位”,您怎么看这种竞争?明年的竞争重点是什么?
李力耘: 原来小鹏智驾是孤勇者,现在是百舸争流,明年的竞争一定会更加激烈和有趣。
今年从“全国能开”逐步走向端到端,比拼的是博弈能力、比拼拟人化。到“车位到车位”之后,我觉得我们处在“无人化的前夜”阶段,小鹏智驾会笃定地走向无人驾驶。
我们希望,明年在能力上有所突破,可能先在Max车型上,小鹏智驾逐步提供类似无人驾驶的能力,接管次数无限降低。随着法规推进,或者新车型推出,我们一定会做出走向无人化的能力。小鹏的最终目标是解放驾驶员的双手、解放精力。
36氪汽车:怎么做到?Scaling Law在智驾领域有效吗?
李力耘: 小鹏是Scaling Law的忠实信徒。虽然最近很多AI前沿工作说Scaling Law、预训练遇到了瓶颈。但从算力、数据量来看,我觉得自动驾驶的Scaling Law还有很大红利。
数据方面,互联网优质数据大概600-700T之后就会有瓶颈。但智驾大部分企业今年才逐步转向端到端,自动驾驶大量优质驾驶数据积累还没有到尽头。
另外,无论车端还是云端算力,都会有着更显著的增长,模型参数也会进一步扩大。我觉得自动驾驶的Scaling Law还没有到尽头。
36氪汽车:行业会有些做法,比如将端到端大模型跟视觉语言模型融合,您认同这种观点吗?
李力耘: 我不反对。这些观点在以不同的视角来描述端到端,在我看来可能殊途同归。无论是视觉语言大模型,还是视觉动作大模型,本质是通过大量数据输入,有一定推理能力,很好地实现类人驾驶的模型。
小鹏以视觉为主,我们实现了“光子进、控制出”。当然,从多模态输入角度来看,视觉只是一个传感器,本身还有各种车道、GPS或者是各种各样多模态输入。
网上的海量数据会让模型有更强的认知能力,识字认路。但是我们认为,拥有高质量的、丰富驾驶数据可以更好解决车辆驾驶的小脑问题,这跟大模型不冲突。
很多驾驶是相对本能的动作,就像人类的小脑,当然也需要大脑的能力。所以在我们的一段式端到端大模型中,Xbrian可以认路识字,做一些简单推理,但更多时候还是对加减速控制、变道时机选择,或者绕行处理,更偏本能的小脑行为。
我们是既希望有聪明的大脑,能够推理思考,还是一个比较灵敏的、肌肉记忆很好的老司机。
36氪汽车:小鹏是从什么时候开始做端到端大模型?
李力耘: 2023年4月份,我们开始布局整个“端到端”技术栈。那时候我们希望用端到端来解决对高精地图的依赖问题,做到全国都能开,所以当时智驾AI化,更注重识路、找路。2023年底,我们意识到需要把端到端的能力进一步扩大,做成一段式端到端。
36氪汽车:2023年4月您和团队当时是怎样的状态?
李力耘: 当时主要在开城,状态很难,因为把高精地图的拐杖扔掉之后,尝试用实时算法去认全国各种各样的路况,并且让车能够配合好行驶,是非常困难的。唯一能够彻底解决这件事就是靠AI,用类人的方法把路认好、把路选好,让车开好。
36氪汽车:那时候就定下了整个端到端、AI模型的框架吗?
李力耘: 方向是笃定的,但我觉得技术变化会非常快。今年以来,我们也看到了类似于Sora、ChatGPT非常强的AI能力涌现。我们也升级了AI的战略,包括对云端模型Scaling Law的认知,紧跟AI最前沿,然后应用在自动驾驶领域。
36氪汽车:小鹏智驾起步非常早,经历了很多个版本,在端到端进化这条路上你们甩掉了哪些包袱?
李力耘: 端到端模型的建立是个非常缓慢的过程。系统工作方式从原来多技术模块变成AI中台。我们会着重建设数据采集能力、数据清洗,模型快速训练、部署、调试,确保模型高效解决问题。
规则还是很重要的兜底能力,一方面是为安全兜底,第二,原来规则积累的工程基础,可以让我们把整个数据闭环、飞轮非常高效地建立起来。
36氪汽车:从2023年到现在,如果要选取比较重大的转折点,您觉得会是什么时刻?
李力耘: 重大转折是今年四五月,小鹏一段式端到端大模型上线之后,我们发现,原来需要花很长时间打磨的一些问题,比如花几个月去打磨一些特殊的分流、右转或者是掉头等场景,解决得特别快,我们很惊讶。
原来的方案是小模块AI驱动,然后做路径规划、速度规划,整个链条非常长,遇到的问题很多。但我们用了AI能力后,环岛掉头、小路、很难的右转场景都有很大的能力提升,效率比原来高很多。
36氪汽车:华为没有把纯视觉当成主流方案,小鹏为什么会这么坚决地要做纯视觉?
李力耘: 其实就是第一性原理。我们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人来设计的,人最重要的传感器是眼睛,所以纯视觉一定是最直接、最高效的解决方案。特斯拉也分享过观点,认为激光雷达+纯视觉1+1并不大于或等于2,而是小于2。
小鹏的AI鹰眼视觉做到了比人的视觉更好的效果。在很多大光差、逆光的情况下会比人眼有更好的识别效果,这也是我们LOFIC架构的特点。当然我们也没有放弃主动的传感器,也会通过多模态跟毫米波雷达,超声波雷达去做融合。
36氪汽车:在高速道路上或者一些特殊天气,激光雷达还是有很好感知效果,小鹏纯视觉有没有解决这种特殊天气场景下的方案?
李力耘: 我恰恰觉得,这些情况下,第一性原理是更好的。再好的激光雷达在远处的点云也是比较稀疏的。激光雷达不是完美的,在一些雨水天气情况下它也有问题。小鹏AI 鹰眼视觉是通过更大算力,看得更清楚、更远、反应更快,车辆反应速度提升了百分之四十几,对场景做出很好的响应。
36氪汽车:后续像在 X9 这些车型上,还是会保留激光雷达和纯视觉两种不同的方案吗?
李力耘: 我们会全系标配Max,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案。
36氪汽车:那方案配置方面,还会分Max 、Pro 吗?
李力耘: 我们会标配Max,从P7+开始。
36氪汽车:小鹏自研的智驾芯片,结合你们的软件方案后,可以发挥出什么样的效果?
李力耘: 小鹏自研芯片的初衷就是实现软硬件一体,最大效能地发挥软件的威力。但更重要的是在云端模型的赋能下,我们会对芯片做针对性优化,给用户提供最好的体验。
36氪汽车:小鹏智驾下一个转折点会是什么时候?
李力耘: 2025年小鹏智驾转折点会在年中,智驾能力会有更大飞跃,可能会从一段式端到端,跨越到全新的 AI 迭代模式。
36氪汽车:智驾行业密集迭代,公司创始人何小鹏怎么保持对智驾前沿的认知?
李力耘: 小鹏智驾真正的一号位和灵魂就是何小鹏。因为他笃定AI,笃定智能驾驶到自动驾驶,才有小鹏智驾的自我变革。他非常从用户视角来看智驾,会去开智驾的中间过程版本和量产版本,感受变化,反馈问题。
所以对行业态势的感知一定是多模态的。现在我们特别注重用户反馈的NPS,智驾每个版本都会去做用户调研。当然也会和顶尖AI企业保持紧密接触,包括去美国开车、取经等,兼听则明。
36氪汽车:何小鹏上一次给你反馈智驾问题是什么时候?
李力耘: 不久前,我们把XOS 5.5.0 过程版也推给了他,他觉得我们又解决了30%-40%的问题。
36氪汽车:端到端方案依赖海量数据,小鹏达成了2000万clips的训练数据,在这方面小鹏有没有什么心得?
李力耘: 得益于两方面,一方面是AI智驾铁军,车端积累多年的规则和严谨算法,很多事情在车端做是事半功倍的。
另一方面,得益于小鹏AI的进展,我们需要大量、高效敏捷地去挖掘数据,训练模型。所以我们既做车端模型、云端模型,也做了非常好的AI工具来挖掘数据。
这背后是组织方式的改变,我们有个AI效能部门,今年年中面向AI成立的新部门,专门训练各种各样的AI提效工具,包括用AI写代码、检查代码、自动挖掘数据。
36氪汽车:小鹏智驾2000万clips的数据是如何达成的?
李力耘: 我们大约在2022年底,就开始预研如何引入AI大模型,已经有了几年的积累。而且我们地把规则时代积累的经验移植到当前的数据采集和训练里,例如通过车端规则经验实时标注,精准采集训练所需片段,从而针对目标场景进行精准密集训练,能够大幅地提升采集和训练效率。
「谈竞争:智驾工业革命,转型成功的是少数」


36氪汽车:友商通过端到端快速实现了高阶智驾量产。端到端会是行业其他人弯道超车的方案吗?






请到「今天看啥」查看全文