本文系深潜atom第835篇原创作品
徐太良丨作者
深潜atom工作室丨编辑
经过漫长又曲折的智驾自研,理想的智驾之路似乎终于走上了正轨。
近日
理想汽车内部确定成立“端到端自动驾驶”实体组织
,团队人数超200人,同时要求公司的其他智能化团队灵活支持该项目。这足以证明理想的这次变革,是下了狠心的。
至于端到端方案是“智驾正轨”的说法,并不是因为行业巨头特斯拉先用、其他新能源车企都在研发,而是这确实是目前所有技术路线内最靠谱的做法。
并且最为重要的是,
“端到端”已经成为了目前所有技术路线中,最能突破天花板的技术
。
靠代码支撑的老智驾方案“规则控制”已经近乎到头了,再往后也只不过是在繁重的代码上增加量,代码之间很容易产生BUG,还会影响车机的内存和运行效率。再加上现在大家都在降本,激光雷达、高精地图、传感器和摄像头的成本都很高,端到端在成本上也有极大的优势。
毕竟底层逻辑就是训练AI来驾驶,喂数据就好了。
同样都是端到端的方案,但理想也有自己的不同。
在近日的“理想汽车智能驾驶夏季发布会”上,理想汽车公开展示了他们的端到端自动驾驶技术架构,由
端到端模型、VLM视觉语言模型和世界模型三部分共同构成
。李想表示,最晚到明年初,理想汽车就会正式推出端到端+VLM自动驾驶的方案。
其实端到端只是一个范本概念,很笼统地讲就是“数据推动”,但是获得数据的模型却大不相同。比如特斯拉用的是BEV+transformer的模型,小鹏的XNGP用的是神经网络XNet+规控大模型XPlanner+大语言模型XBrain构成的模型。
可是“模型越少,输出越精确”。
不对啊?难道不是模型越多,数据越多,输出的也就越精确吗?
要解释清楚这个问题要用到很多的专业术语,模型之间的“显式输出”会导致部分信息的损失,简单一些来说其实就像“接龙传话”的游戏,传话的人越多,到最后就越有可能跑题,最精准的反而是两个人玩。
ONE-Model是所有做智驾车企都在追求的路线,理想目标是在近两年达成,但想要彻底达成再上车,可能还需要三五年的时间。
在这三五年中,大家比的是数据量。
前面我们说了,端到端的底层逻辑就是训练AI,怎么让AI更智能?那就只能喂数据。
或者说,在这三五年里,大家比的是“资源”,数据的资源。
马斯克曾经对端到端模型的训练量做出了精准的描述。
“用100万个视频case训练,勉强够用,200万个稍好一些,300万个,会感到WOW,到了1000万个,就变得难以置信了”。
1000万个视频片段训练成的智驾方案,是理想在今年年底要达成的目标。
想要获得数据,要靠自家用户的驾驶数据,其次就是靠训练芯片。
马斯克在4月份疯狂购入英伟达H100AI芯片,从原本的3.5万采购量加到了8.5万。
后知后觉的理想,最近也开始高价收购英伟达的芯片。
除了数据之外,算力也是影响智驾能力的重要一环。车机芯片的算力以目前来说,Orin X芯片算是天花板了,想要突破这个天花板以及再进一步降本,比的是智驾算力中心的云端算力。
在算力上,华为仍然是国内的第一梯队,算力达到了3.5EFLOPS,小鹏仅为0.6EFLOPS,蔚来稍好一些1.4EFLOPS,理想做到了2.4EFLOPS。
在“理小蔚”的阵线中,理想已经逼近行业头部的水平。