专栏名称: 深网腾讯新闻
《深网》是一档原创深度报道栏目,挖掘TMT领域热门公司、事件和人物中的隐秘故事,探究背后的深层逻辑。
目录
相关文章推荐
新华社  ·  菲律宾前总统杜特尔特被拘留! ·  昨天  
扬子晚报  ·  卢森堡王子去世!年仅22岁 ·  昨天  
人民日报  ·  全国政协十四届三次会议闭幕 ·  2 天前  
51好读  ›  专栏  ›  深网腾讯新闻

借DeepSeek东风,中国车企将弯道超车特斯拉? | 深网

深网腾讯新闻  · 公众号  · 社会  · 2025-02-28 11:19

正文

图片

图片 图片来源:视觉中国


文丨程潇熠 编辑丨叶锦言


出品丨深网·腾讯新闻小满工作室

图片

DeepSeek接入到汽车上,到底有什么用?

“之前整个(汽车)行业的都是这样一个认知,就是谁投入大投入早,就会在AI这块建立绝对的壁垒。”极氪汽车副总裁、智能座舱及电子电气架构负责人姜军称,DeepSeek正在消解车企过往以“AI先发优势”构筑的竞争壁垒。

DeepSeek将工具链、蒸馏技术等工程方法开源的做法,让车企能用更低的成本让自研大模型能力达到更高水准。

这相当于DeepSeek为所有人呈上了武功秘籍、珍馐秘方,让每个人都有机会练就绝世武功,烹制出美味佳肴。

“接入DeepSeek只是非常非常初级的应用。”姜军说,只把DeepSeek作为产品放在车上局限性非常大,对车企更大的收益是提供了一种技术来优化车企研发效率,增强自研大模型的能力。“靠一个模型打天下是不可能的,控制窗、控制空调这些只有你自己的大模型才能跟这些单元连接到一起。”

DeepSeek的出现对此前一直被笼罩在特斯拉智能化技术阴影下的国内车企无疑是强有力的助力。据不完全统计,截至2月27日,已有超过20家车企和汽车品牌宣布接入DeepSeek,包括比亚迪、吉利、理想、极氪、零跑、广汽、长安等主流车企。

多家车企接入DeepSeek是否会导致功能同质化内卷状况愈演愈烈?车企怎么做才能把DeepSeek用好?有了DeepSeek后车企还需要囤算力吗?车企如何解决大模型幻觉等问题?

我们与在汽车智能化、自动驾驶领域有十几年经验的姜军聊了聊。姜军曾任华为自动驾驶产品线核心团队负责人,如今在极氪汽车负责智能座舱、电子电气架构,2023年底开始带队研发座舱场景大模型。

在最近一个月里,姜军和团队完成了极氪自研Kr AI大模型与DeepSeek R1大模型的深度融合,并首推端侧Kr AI大模型的离线部署,可在无网络环境下进行实时图文理解和推理,预计今年内覆盖8295座舱平台全品类车型。

以下是姜军的交流实录,在不改变原意的情况下,略有调整:

图片

DeepSeek, 车企也需要自研大模型

Q:你怎么看朱啸虎认为现在开源AI足够好,其他公司都没有必要训练自己的模型的观点?

姜军: 每个领域都有自己的场景,手机有手机的场景,PC有PC的场景,车有车的场景,不同的场景,应用的方式也不一样,不是说直接拿个产品过来就行。

比如,把DeepSeek作为一个产品,直接拿到车里来使用,这个局限性非常大。

就像手机上也有DeepSeek的App,相当于你不用手机,在车机上直接喊就可以了,这种只是把链路打通了。接入DeepSeek,我觉得只是非常非常初级的智能化应用。

DeepSeek对我们最大的收益是它提供了新的技术、方法和思路,帮助我们增强我们自研的Kr AI垂域大模型。但在座舱场景,大模型推理出结果后,还要去控制车上的各个单元,比如控制窗、控制空调、控制座椅,这些东西只有你自己的大模型才能够跟这些单元连接到一起。

Q:所以说目前行业大模型仍然是刚需?

姜军: 针对不同领域的问题解决,肯定要有针对这个的问题专有大模型能力的。我们主要是从产品和技术两个方面对DeepSeek进行深度的使用和融合。

Q:从通用大模型到实际应用,中间需要进行Prompt工程化。是否可以理解为虽然大家都接入了DeepSeek,但是最终呈现出来的效果并不一样?

姜军: 是的,这个是完全不一样。

针对DeepSeek,只是简单的接入,链路打通也会涉及到工程能力,毕竟你要把用户的语音转换成文字,然后输入给大模型。那语音做的比较好的,转化比较准,语音做的差一点的,一些同义词、近义词如果转化不准,那DeepSeek给你的输出,可能也不会准了。

另外,目前简单接入的DeepSeek更多是用于闲聊,获取知识为主。如果需要获取更准确的实时信息、以及在车里更加有情绪化情感化的与用户对话,这都依赖背后额外的算法工作和工程化工作,也就是从算法到产品化中间还有很多步骤。

如果是将DeepSeek的领先技术赋能给自研大模型,那更多的是看谁能把这些先进经验吃得更透、用的更好,这一块各家差异一定会更大,这些差异带来的最终用户体验,也会天差地别。

Q:DeepSeek的出现,颠覆了哪些车圈原有的认知?

姜军: DeepSeek在大模型工程领域有非常大的创新。首先,之前整个行业的都是这样一个认知,就是谁投入大投入早,就会在AI这块建立绝对的壁垒。

但DeepSeek把工具链、蒸馏技术等工程方法做了创新开源后,大家能用非常低的成本使车企自研大模型的能力达到一个相对较高水准的状态。

另外,之前很多大模型还是基本集中在一问一答的状态,但DeepSeek的强推理能力不是简单的给一个回答。

我举个例子,之前大家在车里跟语音助手说‘我现在有点热’,它可能会做一个非常直接的操作,比如降低空调温度。现在有推理能力后,你再说‘现在有点热’的时候,它会根据当前车内外的温度情况,当前是否开窗,甚至你上车后的情绪状态,甚至穿的衣服厚不厚,来推理出最优调控方案。

不是简单调空调温度,它可以去调温度、内外循环、窗户的控制等等,真正的解决你的问题。

图片

AI未到天花板,算力仍 然重要

Q:DeepSeek降低算力需求后,车企还需要囤算力吗?

姜军: DeepSeek的出现是节约了算力,但并不是说现在已经到终点,AI已经到天花板了。如果是AI已经到了天花板,那大家以后就不需要那么多算力了,但是AI还有一个相当长的路要走。

我举个例,比如在相同算力下,你之前只能考到30分,现在能考到60分。但60分也不是终点,你要考到95分以上、100分,还是要有算力的支撑。你的算力越强,你可能会更快从60分达到90分。

Q:那车端还需要追求高算力芯片吗?

姜军: DeepSeek出来了之后,当下旗舰座舱计算芯片可以部署一个比较小的,比如说1.5B模型的能力。它虽然有一定的助力,但现在端侧座舱算力还不足以支持大模型能力的发挥(即主动智能)。

正因为算力不够,所以你会发现当前座舱相比智驾在大模型领域没那么卷。另外有许多基于隐私保护考虑,一些模型还是要在端侧持续迭代。

我们认为在2026年,下一代座舱芯片出来后,座舱端侧能力会大幅度增长。那个时候座舱端算力不再是瓶颈,整个行业也会卷起来,在2026年形成智驾卷L3,座舱开始真正卷AI座舱的时代。

Q:怎么看新一代智能硬件的更新也会“淘汰”旧设备收集的数据的问题?

姜军: 首先不能绝对得讲历史数据完全不能用。

怎么把历史数据进行提炼、转换,最后变成现在新的硬件算法上能否使用的数据,这也是一个工程能力。用的好,历史数据就能把你新产品的能力先推到80分,那推到80分之后,再快速的利用新的数据推到95分以上。

图片

靠一个模型打天下是不可能的

Q:DeepSeek的思考过程,对需要快速决策的车内场景来说,会不会反而是负担?

姜军: 车内有不同的使用场景,不同场景对准召率有不同的要求。

有些场景涉及到安全要迅速反应,比如用车过程中监测操作疲劳,要马上提醒他,对实时性要求比较高。有些场景1秒识别还是5秒识别不重要,结果很重要,比如识别情绪,在他心情不好的情况下调节车内温度、歌曲让他心情舒缓。

靠一招鲜,一个模型打天下,那是不可能的。所以我们Kr AI大模型设计了思考与推理中枢,其实就是起到了对不同模型调度的能力。

Q:DeepSeek-R1是大语言模型,但汽车场景更多需要多模态的能力,DeepSeek在车上发挥的作用是否比想象中更少?

姜军: 目前座舱主流的智能化还集中在对语音助手的理解和推理,这个方面DeepSeek-R1是有非常强的助力的。DeepSeek-R1的技术创新经验,也对我们Kr AI大模型多模态能力的提升帮助很多。

Q:车企怎么解决AI幻觉问题?在Vectara HHEM人工智能幻觉测试中,DeepSeek-R1幻觉率高达14.3%,远超其他模型水平。

姜军: 对,这也是工程能力的一部分。你像极氪针对不同场景,我们除了DeepSeek之外,也接入了很多其他大模型。因为不同的通用大模型,它在不同方面的能力是不一样的。有些百科能力比较强,有些新闻的实时性比较强。

我们在最后大模型输出的内容上,还增加了另外几个大模型,有些就是风控模型。如果大模型产生幻觉,导致它回答了一些不应该回答的问题,要能拦得住。保证它该说的说,不该说的就不说,说不对的,要能保证它纠正过来。

我们经常讲工程无捷径。技术是可以有跨代性的技术可能性,工程在AI时代可以有更高的效率,但还是要踏踏实实的把每一步都做好,没什么特殊的捷径。

Q:DeepSeek能绕开部分英伟达CUDA,这种技术突破为车企带来哪些实质效益?

姜军: 更多是整个效率的提升。比如说通过CUDA去使用GPU,相当于间接调用,中间可能会有损耗。可能本来只需要训练10小时的,那你就需要训练20个小时。

Cuda为AI研发提供了一套丰富的工具链和三方库,它封装的这些Api非常适合开发者简单调用和计算。DeppSeek能绕过一些Api,用PTX指令集更接近硬件的优化,这是一种更细颗粒度、更底层的技术,意味着在追求计算效能方面也不断有打破常规,更深一步的方式出现。也为车企在AI架构开发上提供了借鉴。我想类似的更深入底层的技术也会是AI持续进步的分支。

图片

2026年将是AI座舱时代

Q:大模型接入后,汽车智能化迭代周期缩短了多少?

姜军: 原来传统的CV从采集数据到场景应用,最快三个月,慢一点要半年。大模型出来后可能是三个月变一个月,半年变三个月。

Q:DeepSeek能取代或简化某些车企的自主研发工作吗?

姜军: 它不是一个取代关系,也不可能直接取代。而是说让我们原来做的工作更有效率,做出来的成果更好。

Q:汽车座舱的终极形态会是什么样的?大模型发展速度和之前预判的有不同吗?

姜军: 我们认为座舱智能化的终局是主动智能。主动智能就是希望给你提供的服务,你不需要吩咐,或者你刚想到它就会主动向你推荐,甚至你没有想到但它能主动发现你需要什么服务。

在2026年端侧算力解决的时候,真正的AI座舱时代就会到来。

因为现在大家对智能座舱,还是聚焦在你跟语音对手说话的时候,它怎么能够更加精确的理解你,更加精确的回答你的问题。

那我们认为未来随着端侧算力的增加,未来的智能化不是简单的看语音助手聪不聪明,而是说它是否懂你。就是它会根据你当前的情绪状态,再结合当前一些内外的场景,你不给它发出指令,它也会根据你的习惯,相关的数据信息,主动给你推送你想要的服务。

并且随着推送的准确率,你的接纳率逐渐增加,他可能之前是询问你是否需要执行,未来他可能直接给你执行之后,再来进行通知。

Q:极氪在2024年下半年看到座舱的终极形态是主动智能,是因为OpenAI推出了第一个推理大模型GPT-o1吗?

姜军: 这个是我们当时做这样的决策和战略部署的输入之一。

当时我们做了很多实验,传统CV视觉会有很多Corner Case,比如识别在车内抽烟这个场景,他抽烟的时候最好降窗透气,但外头下雨咋办?或者他进入隧道了怎么办?当时AI的状态,它没法理解这么多东西。

大模型来了以后,它能有更好的理解,比如下雨天的时候不会野蛮降窗,可以给你开个缝,或者提示你通风透气。

之前我们相当于看到了(主动智能)的一个缝,DeepSeek来了之后,我会觉得这个缝变成了一个门。







请到「今天看啥」查看全文