专栏名称: 华泰睿思
华泰证券研究所微信公众号,致力于为投资者提供研究团队的最新研究成果,推介优质研报,并预告最新的联合调研、专题会议等活动。
目录
相关文章推荐
上海证券报  ·  央企大动作!早盘涨超85% ·  昨天  
中国证券报  ·  首金来了,祝贺李方慧! ·  3 天前  
中国证券报  ·  刚刚,外汇局公布 ·  3 天前  
中国证券报  ·  601211,下周一复牌! ·  3 天前  
51好读  ›  专栏  ›  华泰睿思

华泰 | DeepSeek的创新是否会削弱英伟达的优势地位?

华泰睿思  · 公众号  · 证券  · 2025-02-11 08:02

正文

点击小程序查看研报原文



核心观点

DeepSeek的创新是否会削弱英伟达的优势地位?
1/20,DeepSeek-R1的发布引发科技行业关注。截至2/8,已经有16家国产AI芯片企业陆续宣布完成对DeepSeek模型的适配或上架服务。我们认为:1)DeepSeek提出的基于混合专家(MoE)的新架构大幅度降低了AI推理系统的硬件要求。2)DeepSeek采用的利用底层硬件指令语言PTX使用GPU的方法为绕开英伟达通过CUDA构建的垄断提供了一条路径,3)国内AI芯片企业快速适配的行动充分展示了中国AI产业链的技术实力和协同效应。

16家国产AI芯片企业宣布完成DeepSeek适配
根据智东西报道,截至2/8,16家国产AI芯片企业陆续宣布完成对DeepSeek模型的适配或上架服务。这些企业包括华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能和芯动力。其中华为昇腾能够提供持平全球高端GPU部署模型的效果,燧原科技已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一系列快速适配的行动充分展示了中国AI产业链的技术实力和协同效应。

创新#1:MoE模型大幅降低AI推理系统成本
我们认为,DeepSeek提出的基于混合专家(MoE)的新架构和FP8混合精度训练等先进技术,大幅度降低了每个专家模型所需要的GPU的性能要求。如图2所示,在价格约120万人民币的HGX H20服务器系统上就能够完整实现媲美OpenAI最新模型的功能。同时,DeepSeek提供了多个简化版本,能够在包括通用PC服务器(预计价格:约10万人民币),台式PC(约3万人民币),笔记本(约2万人民币)的平台上运行,为端侧智能的发展提供契机。

创新#2:底层硬件指令语言PTX可能绕开英伟达在CUDA垄断
包括OpenAI,Meta在内大部分AI大模型企业都采用英伟达提供的通用编程架构CUDA(Compute Unified Devices Architectured)访问GPU。CUDA的优势是不用考虑GPU硬件细节,易于上手和使用,但只支持英伟达自己的GPU。DeepSeek采用的利用底层硬件指令语言PTX使用GPU的方法为绕开英伟达通过CUDA构建的垄断提供了一条路径。国内芯片企业也在积极优化自身产品,例如昆仑芯的P800显卡对MoE架构的支持性较好,单机8卡即可运行671B参数模型。这些因素共同促进了DeepSeek在国产AI芯片上的快速适配。


图片


风险提示: 贸易摩擦风险,半导体周期波动。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。


相关研报

研报: 《DeepSeek的创新是否会削弱英伟达的优势地位? 》2025年2月9日

黄乐平 分析师 S0570521050001 | AUZ066

陈旭东 分析师 S0570521070004 | BPH392

于可熠 联系人 S0570122120079 | BVF938


关注我们


华泰证券研究所国内站(研究Portal)

https://inst.htsc.com/research

访问权限:国内机构客户


华泰证券研究所海外站

https://intl.inst.htsc.com/research

访问权限:美国及香港金控机构客户
添加权限请联系您的华泰对口客户经理






请到「今天看啥」查看全文