我们认为本轮的智驾行情,将会是AI赋能下,汽车板块大周期的开启。本轮的智驾演绎将有望沿着以下路径演绎:DeepSeek引爆中国AI科技股重估→DeepSeek对智驾启发&比亚迪等智驾平权→智能汽车销量提升&渗透率大幅提升甚至超预期→智能驾驶乃至整个汽车板块迎来EPS与PE提升的戴维斯双击。
点击小程序查看研报原文
DeepSeek为智驾算法-算力-数据多维度带来借鉴,催化行业创新
DeepSeek通过多种技术手段大幅提升算力利用效率并降低训练成本,在算法、算力和数据等多维度对智驾产业发展提供了技术层面的借鉴或启发。目前众多车企和Tier1企业正积极探索DeepSeek的应用,我们预计25H2有望见到在智驾领域的上车,智驾二线梯队借助新的AI工具有望加速追赶,第一梯队因先发优势和人才优势走在创新前列,共同推动智驾平权与中高阶智驾渗透率高增。我们预计本轮智驾行情,将会是AI赋能下汽车板块大周期的开启,智能驾驶乃至整个板块有望迎来EPS与PE提升的戴维斯双击。
算法
:
Deepsee
k
部分技术
有望
启迪
提升云端训练效率,
具备车端上车
可能
DeepSeek通过MLA/DeepSeekMoE/ MTP/FP8混合精度训练等多种手段提升训练和推理效率并降低成本。智驾领域有望通过对DeepSeek相关技术借鉴提升云端模型训练速度并降低训练成本。此外如理想、极氪、元戎等使用或计划VLM、VLA多模态大模型上车,DeepSeek模型表现出的高效训练、良好的多模态处理能力、高效的蒸馏方式,有望吸引车企的尝试,甚至后续直接替代车企原有的VLM/VLA的模型选择。DeepSeek或率先在座舱领域实现应用,加速本地大模型部署,实现智能化、个性化进一步升级,目前比亚迪、吉利、岚图、零跑、极氪、智己等已有相关规划。
算力
:
蒸馏技术
降低
车端算力
要求,短期或缓解
云端算力紧
缺
DeepSeek的蒸馏技术可将云端大模型的推理能力高效迁移至车端轻量模型,有望在保持高性能的同时显著降低计算开销,加速VLA、世界模型等上车。在实现同等智驾体验的情况下,预计对车端算力的需求将降低。同等算力下或可实现更多智驾功能,甚至通过中算力芯片实现城市NOA功能,助力高阶智驾功能向 10-20 万元价格带车型下沉。云端算力方面:短期或缓解云端算力紧缺,使得国内厂商能够利用相对有限的算力资源开展大模型训练,获得追赶的重要窗口期。但长期随着模型复杂度的持续提升、应用场景的不断拓展以及数据规模的指数级增长,云端算力需求仍将持续增长。
数据
:加速构建数据闭环并积累高质量“老司机”数据
DeepSeek-R1-Zero 验证了纯强化学习无需监督微调数据即可实现自主推理能力,为智驾端到端训练提供新范式参考;此外DeepSeek采用基于强化学习(RL)的训练框架(如GRPO算法),通过自博弈机制生成多样化驾驶决策数据,可在仿真环境中探索不同驾驶策略(如变道时机、紧急避让),生成覆盖长尾场景的交互数据,实现自动扩展数据分布,减少对人工标注的依赖,助力实现数据的自动采集、标注、训练与反馈,加速数据闭环迭代。
投资建议:
我们认为本轮的智驾行情,将会是AI赋能下,汽车板块大周期的开启。本轮的智驾演绎将有望沿着以下路径演绎:DeepSeek引爆中国AI科技股重估→DeepSeek对智驾启发&比亚迪等智驾平权→智能汽车销量提升&渗透率大幅提升甚至超预期→智能驾驶乃至整个汽车板块迎来EPS与PE提升的戴维斯双击。具体投资建议上,我们推荐关注:1)车企端:拥有较强工程化能力,在数据、算力、资金具备优势的车企,在25年践行智驾平权的车企,以及加速智能化追赶的部分车企。2)第三方供应商:看好在自主品牌乃至全球品牌获得潜在增量定点机会的相关公司。具体公司名单请见研报原文。
风险提示:智驾落地速度不及预期;对DeepSeek的探索仍处于初期;竞争超预期加剧。
DeepSeek:开源大模型新星,或催化中高阶智驾加速渗透
DeepSeek为智驾算法-算力-数据多维度带来借鉴,催化行业创新
智能驾驶是
AI
技术最具前景且能快速落地的应用场景之一。
DeepSeek
的横空出世,
实现了成本和技术上的双突破,
不仅
为
智驾领域
带来了技术层面的直接借鉴,更在发展思路等方面提供启示,有望催化
智驾领
域的技术
创新
和产业变革,加速中高阶智能驾驶的渗透。
本报告主要探讨DeepSeek对于智驾算法、算力、数据等多维度带来的影响;然后分析其有望加速中高阶智驾渗透并助力后发企业加速追赶,给出具体投资建议;最后则补充介绍DeepSeek的重要贡献供参考。
1
)算法层面
MOE/
MLA
/
MTP
等
方式
提升模型性能和
训练
效率
,
有望
借鉴相关技术
加速智驾模型
训练速度并降低训练成本
。
在架构设计方面,DeepSeek-V3 采用了MLA(多头潜在注意力)来确保推理效率,并使用 DeepSeekMoE(混合专家架构)来实现经济高效的训练,此外还开发并验证了MTP(多token预测)训练目标。即使无法直接利用DeepSeek模型进行开发,但通过对DeepSeek相关技术的借鉴,
各家企业
有望
提升
对于云端模型的训练速度并降低训练成本,从而加速
智驾系统
迭代。
DeepSeek
有可能替代此前车企选择的
VLM/VLA
模型
。
DeepSeek-R1 系列模型基于 Qwen/Llama 等开源框架,并采用 MIT 许可协议。目前理想部署“端到端+VLM”双系统,VLM负责复杂场景的逻辑推演(如交通规则、施工改道),端到端模型负责实时响应;极氪计划在2025年引入VLM,用于处理可变车道等语义信息;此外元戎启行计划25年推出VLA系统上车(VLA 较 VLM 增加了对物理动作的生成与控制能力,能够直接将视觉和语言输入转化为具体的动作指令)。
理想汽车
VLM
模型基座是
通义千问开源
模型,而
DeepSeek
模型表现出的高效
训练、良好的多模态处理能力、高效的蒸馏方式,有
望
吸引车企
的尝试,甚至后续
直接
替代车企原
有的
VLM/VLA
的模型选择。
但需要注意的是,由于车企智驾模型的研发和上车需要考虑全面的安全验证,短期内或较难出现直接基于DeepSeek模型开发的智驾系统,并且DeepSeek-R1推理能力虽强但也有较多的幻觉,基于DeepSeek-R1模型开发时需应对此问题。
2
)
算力层面
车端算力
:
DeepSeek
高效的
蒸馏技术
可
启发车企
创新
,使得
车端算
力
要求
降低
,加速
VLA
、世界模型等上车
。
DeepSeek的蒸馏技术可将云端大模型的推理能力高效迁移至车端轻量模型,有望在保持高性能的同时显著降低计算开销,为 VLA、世界模型等复杂模型在车端部署扫清算力障碍。
在实现
同等智驾
体验的情况下,
预计
对
车端算
力的需求
将降低
;而同等
算力下
,或可以实现
更多智驾功
能
,甚至可能通过ORIN-N或J6E等中算力芯片实现城市NOA功能,助力高阶智驾功能向 10-20 万元价格带车型下沉。
但需要注意的是,有学者认为,蒸馏技术虽然可以提高模型训练效率,但借此开发的模型无法超越基础模型的能力,且可能导致研发人员为了快速取得成果而放弃对基础模型的探索。
故
未来
云端车端协同
分工或将会是:云端模型
负责复杂模型的训练和迭代
,不断探索上限
;
车端模型
则更注重效率和成本,
将云端模型蒸馏到车端,
负责实时推理和决策。
云端算力:短期
或
缓解
云端算力
紧缺
,但长期云端
算力需
求仍将持续增长
。
在目前特斯拉在云端算力大幅领先的背景下,DeepSeek 的低成本训练模式,使得国内厂商能够利用相对有限的算力资源开展大模型训练,获得追赶的重要窗口期。不过尽管 DeepSeek 技术降低了单次模型训练的算力需求,但长期来看,随着模型复杂度的持续提升、应用场景的不断拓展以及数据规模的指数级增长,自动驾驶对云端整体算力的需求仍将呈现长期增长趋势。
3
)数据层面
纯
RL
路径验证
合成
数据价值,数据闭环驱动模型持续进化
。
DeepSeek-R1-Zero 验证了纯强化学习(RL)无需 SFT 数据即可实现自主推理能力,为智驾端到端训练提供新范式参考;此外DeepSeek采用基于强化学习(RL)的训练框架(如GRPO算法),通过自博弈机制生成多样化驾驶决策数据,可在仿真环境中探索不同驾驶策略(如变道时机、紧急避让),生成覆盖长尾场景的交互数据,实现自动扩展数据分布,减少对人工标注的依赖,助力实现数据的自动采集、标注、训练与反馈,加速数据闭环迭代。
在智驾领域
,数据的质量及其与实际驾驶场景的相关性也愈发重要
,
DeepSeek
有望
成为车企
在智能驾驶数据端一个高效有力的工具
。
DeepSeek-R1的冷启动数据是通过多种方法收集和筛选的,其目的是为模型提供高质量的初始训练数据,从而避免在强化学习(RL)训练初期出现不稳定现象。并且DeepSeek通过使用数据蒸馏技术(Distillation),从复杂原始数据中提炼高质量训练数据,减少标注工作量,显著提升训练效率。智驾领域高质量数据需要具备对现实场景的高度代表性,确保模型在训练中学习到有效的信息。例如,理想汽车利用“老司机”策略,从车主中挑选 3%的高评分驾驶员数据作为高质量训练样本,同时确保了训练数据规模和相关性。在端到端架构中,数据标注不仅要满足感知的需要,还必须为整体决策和控制提供足够的信息支持,因此标注往往需要更精细的层次。标注错误或不一致的数据可能会对整个模型的学习效果产生较大影响。
4
)
组织架构和人才
的启示
AI
大模型
高速迭代
下更加强调人才
质量
,而非工程师
数量
;同时也对公司组织架构提出挑战。
参考 36 氪对DeepSeek的专访,DeepSeek对于员工要求强调好奇心和热爱,“前 50 名顶尖人才可能不在中国,但也许我们能自己打造这样的人”。此外DeepSeek 作为初创公司,团队规模精简,组织架构扁平化,且专注于研究领域。AI大模型时代下更加强调算法人才,特别是具备前瞻视野的 AI 领军人才,智驾领域也呈现类似的情况,
小
鹏智
驾负责人李力耘认为在规则时代,公司需要熟练掌握计算机语言、算法的人,但是现在更希望有能够熟练驾驭
AI
工具去解决问题的人才。
特斯拉以200-300人的智驾团队,交付全世界最大的自动驾驶车队正是如此。
5
)智能座舱
DeepSeek
有望催化
本地化大模型
加速
部署
,实现座舱智能
化
、个性化的
进一步升级
。
相对智驾系统,座舱系统对于安全性和实时性要求相对较低,对于DeepSeek的融合和借鉴速度更快。座舱本地化大模型部署,一方面可以减少对云端网络的依赖,降低延迟,提高响应速度,同时更好地保护用户隐私;另一方面有望实现个性化体验升级,实现“千人千面”的智能座舱。2月6日,吉利汽车宣布自研大模型与 DeepSeek 完成深度融合,将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练,可将 DeepSeek R1 的类人推理能力迁移到车端大模型上,在不降低性能的前提下,提高运行效率和响应速度,并且使车辆能更精准调用约2000个车载接口(如空调、导航、娱乐等模块),主动分析用户潜在需求,实现从"被动响应"到"主动服务"的转变。此外岚图汽车也已经在车机系统融合和蒸馏DeepSeek R1模型,自2月14日起便可以通过OTA更新体验;比亚迪、极氪、零跑、智己等也已经有相关规划。
投资建议
我们认为2025年中高阶智驾将加速渗透,而Deepseek的横空出世,大幅提升算力利用效率并显著降低了模型训练成本,我们认为其具体技术和发展思路上都将对智能驾驶提供宝贵借鉴和启示。我们认为:
1
)
我
们预计
25H2
与
DeepSeek
结合的系统或工具有望上车,
AI
创新工具涌现和“智驾平权”驱动行业渗透率高增
。
目前头部智驾企业正积极探索DeepSeek的应用,我们预计25年下半年与DeepSeek结合的系统或工具有望上车。我们维持年度策略报告对25年智能驾驶渗透率的预测,预计2025年高速NOA(此处代表具备高速NOA但不具备城市NOA功能)和城市NOA渗透率将会有明显提升,渗透率分别有望达到15%/13%。但我们对2026年行业渗透率提升保持乐观,一是因为类似DeepSeek的工具正在逐渐涌现助力行业技术变革,二是以头部车企为代表的“智驾平权”的引领作用。
2
)
格局上,
借助
D
eep
S
eek
等新的
AI
工具
,
后发企业或加速追赶
,第一梯队因先发优势和人才优势走在创新前列
。
DeepSeek模型开源,一系列手段实现低成本的训练,并且可通过蒸馏提升小模型性能等等,都对智驾产业提供重要借鉴,我们认为可以使得智驾领域相对后发的企业追赶第一梯队。但是第一梯队企业在大模型、算力以及数据的积累仍有较大优势,尤其是更能够吸引行业顶尖人才,走在创新前列,亦使得强者恒强。由此带来的结果仍是行业创新加快。
投资建议:
我们认为本轮的智驾行情,将会是AI赋能下,汽车板块大周期的开启。
本轮
的智驾演绎
将
有望
沿着以下路径演绎:
DeepSeek
引爆中国
AI
科技股重估
→
DeepSeek
对智驾启发
&
比亚迪
等智
驾平权
→
智能汽车销量提升
&
渗透率大幅提升甚至超预期
→
智能驾驶乃至整个汽车板块迎来
EPS
与
PE
提升的戴维斯双击。
具体投资建议上,我们推荐关注:
1
)
车企端
:
拥有较强工程化能力,在数据、算力、资金具备优势的车企,在25年践行智驾平权的相关企业,以及加速智能化追赶的车企。
2
)
第三
方供应
商
:看好在自主品牌乃至全球品牌获得潜在增量定点机会的相关公司。
DeepSeek:开源大模型领域新星,成本和技术实现双突破
DeepSeek
成立以来
发展迅速,最新
模型
R1
与
OpenAI
的
o1
正式版
性能
持平
。
DeepSeek成立于2023年7月,同年11月成功发布了首个开源代码大模型——DeepSeek Coder。此后,DeepSeek持续推出了一系列里程碑式的模型,包括拥有670亿参数的通用大模型DeepSeek LLM、2360亿参数的混合专家模型DeepSeek-V2,以及参数规模高达6710亿的DeepSeek-V3。2025年1月,新一代推理模型DeepSeek-R1面世,性能与OpenAI的o1正式版持平并开源。
DeepSeek
V3
正式训练成本仅
557.6
万美元,
DeepSeek-R1 API
服务定价
远低于其他模型。
训练成本方面:
据DeepSeek V3技术报告,V3模型的正式训练环节总计只需要278.8万GPU小时,成本约557.6万美金,远低于同类模型训练成本,如Llama 3系列。API
定价方面:
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元,远低于openAI的相关模型。
2025
年
1
月以来
DeepSeek
用户量迎来
快速
增长
,
国内外各大云厂商选择布局引进。
据极客网统计,截至2025年2月4日,其日活跃用户数(DAU)2215万,占ChatGPT日活跃用户数的41.6%。月活跃用户数(MAU)在上线21天后达到3370万,跻身全球AI产品月活总榜前四。累计下载量在上线25天内达到4000万,远超ChatGPT首次发布的首月下载量900万。同时,国内云厂商如华为云、腾讯云、阿里云、百度智能云等纷纷宣布上线DeepSeek-R1,提供从一键部署到推理优化的全方位服务。海外云厂商和芯片厂商也积极响应,英伟达、AMD、亚马逊AWS和微软Azure等均宣布上线DeepSeek-R1,掀起了一场全球范围的“模型风暴”。
参考
DeepSeek
相关技术文档,我们认为
deepseekV3
和
R1
模型的重要贡献
/
创新点包含以下几个方面:
1
)
多种技术手段
提升训练和推理效率
并降低成本
。
在架构设计方面,DeepSeek-V3 采用了MLA来确保推理效率,并使用 DeepSeekMoE来实现经济高效的训练。这两种架构在 DeepSeek-V2 中已经得到验证,证实了它们能够在保持模型性能的同时实现高效的训练和推理。除此之外,V3和R1模型引入无辅助损失的负载均衡策略,通过动态调整专家的负载,确保在训练过程中各个专家之间的负载更加均衡,从而避免因负载不均导致的性能下降。DeepSeek还引入多token预测(MTP)训练目标,使其能够同时预测多个未来词元,从而提高了训练信号的密度,进而可能提升数据效率,该技术还可用于推测解码来加速推理过程。此外DeepSeek还采用FP8 混合精度训练技术提升训练速度,采用组相对策略优化和规则化奖励策略使得推理更加高效。
2
)不仅
DeepSeek-R1
在多项基准测试中
媲美
OpenAI
顶尖模型,并且可以通过知识蒸馏技术提升小型模型表现。
DeepSeek-R1在IF-Eval中表现出色,生成摘要简洁,避免长度偏差。在数学和编程任务中,R1与OpenAI-o1-1217相当,未来版本有望进一步提升工程性能。知识蒸馏是一种大模型压缩和加速技术,旨在将大型模型(教师模型)所学到的知识迁移到小型模型(学生模型)中。通过利用DeepSeek-R1生成的推理数据,DeepSeek团队对基于 Qwen 和 Llama 的系列小模型进行了微调,发现经过知识蒸馏的小型模型在基准测试中表现优异,例如DeepSeek-R1-7B在各项指标上超越了GPT-4o-0513等非推理模型,DeepSeek-R1-32B和DeepSeek-R1-70B在大多数基准测试中显著超越了o1-mini。此外DeepSeek研究发现对这些蒸馏模型应用RL(强化学习)进一步显著提升模型效果。
3
)
通过纯强化学习训练,无需
预先进行
监督微调(
SFT
),即可提升推理能力。
以往的研究大多依赖于丰富的监督数据,或是借助预训练模型并辅以监督微调(SFT)来提升模型性能,这种方法通常要求使用标注过的数据对预训练模型进行针对性训练,以适应特定任务,从而提升其执行该任务的能力。然而,DeepSeek-R1-Zero模型的诞生颠覆了这一常规路径,DeepSeek-R1-Zero中期版本出现了“aha moment”,即模型获得自主思考复核能力,证实了无需借助监督微调数据,模型通过单一RL机制实现有效学习和泛化的能力。
4
)
最后值得注意的是
,
R1
模型中少量
高质量
冷启动数据
提升了模型可读性和性能,
数据
蒸馏技术提升数据
质量
。
DeepSeek-R1 的冷启动数据是通过多种方法收集和筛选的,其目的是为模型提供高质量的初始训练数据,从而避免在强化学习(RL)训练初期出现不稳定现象。冷启动数据的加入实现了:①模型可读性增强:克服了DeepSeek-R1-Zero输出内容可读性差的局限;模型性能提升:②基于人类认知模式优化的冷启动数据设计,展现出优于DeepSeek-R1-Zero的性能表现。冷启动数据主要包括:①基于长CoT示例的少样本提示;②直接提示生成包含反思验证的详细答案;③整理DeepSeek-R1-Zero的规范化输出;④人工标注后处理优化。并且DeepSeek通过使用数据蒸馏技术(Distillation),从复杂原始数据中提炼高质量训练数据,减少标注工作量,显著提升训练效率。
风险提示
智驾落地
速度不及预期
2025年智能驾驶将是各家车企竞争焦点,但智驾落地速度受到用户付费意愿、厂商技术研发、相关法规等多方面因素影响,部分车企可能智驾落地速度不及预期。
智驾公司
对
DeepSeek
的探索仍处于初期
DeepSeek引起广泛关注时间较短,各家企业对于DeepSeek的探索仍处于初期阶段,后续DeepSeek带来的技术赋能的效果,乃至基于DeepSeek直接进行开发,均存在不确定性。
竞争超预期加剧
若2025年汽车市场竞争超预期加剧,可能导致整车和零部件企业出现收入下滑乃至亏损的风险。