“没有中国数据,不要期待太高。”对于已经推送的 FSD 功能,一名智驾方案厂商的高管直言。无法实地收集道路数据进行训练,是特斯拉 FSD 难以真正落地部署的瓶颈。
FSD 在中美数据合规问题上面临两难困境。“中国不允许特斯拉将训练数据转移到境外,而美国政府又限制特斯拉在中国进行训练”,马斯克在2024 年四季度财报电话会上说道。这是近乎死结状态。
FSD 自采用 “端到端”技术架构后(一端输入传感器获得的数据,另一端直接输出控制结果),数据驱动变得尤为关键,需要大量用户实际驾驶的真实数据进行训练,模型才能够主动学习人类的驾驶习惯。
但问题是,目前特斯拉很难收集中国的道路数据,在各项合规工作没有到位前,其只能通过工程车在限定区域进行部分道路进行数据采集。也就是说,即便其在中国一年卖出了近 66 万辆车(2024年中国市场的销量),其本地数据量也是堪忧。
马斯克表示现阶段只能在互联网上找一些中国道路的视频给 FSD 先训练,但这种数据质量始终和实地采集的道路数据难以比拟。不仅如此,中国的交通法规和道路环境与美国差异较大,诸如公交专用道、导流岛、待行区等特殊区域都是中国道路特殊场景。
马斯克此前在财报电话会议上就曾透露,FSD 在中国面临的最大难题之一是公交专用道。“在中国,一天当中有好几个小时是规定了公交车道的使用时间,如果你不小心在错误的时间驶入了公交车道,就会立刻收到一张罚单。”马斯克说道。
对交规难以理解是一方面,中国道路中的快递员、外卖骑手等交通参与者进一步增加了交通复杂性,对FSD提出了更高的要求,这涉及的是安全性问题,而这背后都需要大量的数据作为训练的支撑。
为了推进 FSD 在符合监管条件下在国内进行部署,特斯拉此前一直在寻求规避一些敏感问题,例如在中国部署数据中心,将数据地图数据服务商将更换为百度地图等。但要满足中美两地的监管需求,特斯拉还需寻求更多解决路径。
另外,算力也是一大瓶颈。特斯拉在海外建了Cortex 超级计算集群用于训练 FSD,拥有约 10 万颗英伟达 H100 和 H200 芯片,是算力规模最大的车企,但这不能用于国内数据训练。
由于国际政策影响,特斯拉也在试图解决中国算力瓶颈问题,有消息称其可能在中国租赁或建算力中心训练 FSD,但这个训练中心的算力能否满足中国庞大的数据训练需求,还未能得知。