华泰 | DeepSeek的创新是否会削弱英伟达的优势地位？

华泰睿思 · 公众号 · 证券 · 2025-02-11 08:02

正文

核心观点

DeepSeek的创新是否会削弱英伟达的优势地位？

1/20，DeepSeek-R1的发布引发科技行业关注。截至2/8，已经有16家国产AI芯片企业陆续宣布完成对DeepSeek模型的适配或上架服务。我们认为：1）DeepSeek提出的基于混合专家(MoE)的新架构大幅度降低了AI推理系统的硬件要求。2）DeepSeek采用的利用底层硬件指令语言PTX使用GPU的方法为绕开英伟达通过CUDA构建的垄断提供了一条路径，3）国内AI芯片企业快速适配的行动充分展示了中国AI产业链的技术实力和协同效应。

16家国产AI芯片企业宣布完成DeepSeek适配

根据智东西报道，截至2/8，16家国产AI芯片企业陆续宣布完成对DeepSeek模型的适配或上架服务。这些企业包括华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能和芯动力。其中华为昇腾能够提供持平全球高端GPU部署模型的效果，燧原科技已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一系列快速适配的行动充分展示了中国AI产业链的技术实力和协同效应。

创新#1：MoE模型大幅降低AI推理系统成本

我们认为，DeepSeek提出的基于混合专家(MoE)的新架构和FP8混合精度训练等先进技术，大幅度降低了每个专家模型所需要的GPU的性能要求。如图2所示，在价格约120万人民币的HGX H20服务器系统上就能够完整实现媲美OpenAI最新模型的功能。同时，DeepSeek提供了多个简化版本，能够在包括通用PC服务器（预计价格：约10万人民币），台式PC（约3万人民币），笔记本（约2万人民币）的平台上运行，为端侧智能的发展提供契机。

创新#2：底层硬件指令语言PTX可能绕开英伟达在CUDA垄断

包括OpenAI，Meta在内大部分AI大模型企业都采用英伟达提供的通用编程架构CUDA（Compute Unified Devices Architectured）访问GPU。CUDA的优势是不用考虑GPU硬件细节，易于上手和使用，但只支持英伟达自己的GPU。DeepSeek采用的利用底层硬件指令语言PTX使用GPU的方法为绕开英伟达通过CUDA构建的垄断提供了一条路径。国内芯片企业也在积极优化自身产品，例如昆仑芯的P800显卡对MoE架构的支持性较好，单机8卡即可运行671B参数模型。这些因素共同促进了DeepSeek在国产AI芯片上的快速适配。

风险提示：贸易摩擦风险，半导体周期波动。本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。

华泰 | DeepSeek的创新是否会削弱英伟达的优势地位？

正文

请到「今天看啥」查看全文