专栏名称: 吉时通信
连通资本与实业,关注大通信业变迁趋势!及时的行业资讯、投研观点分享
目录
相关文章推荐
新京报书评周刊  ·  从佛教到道教,哪吒如何成为中华文化中的护法神? ·  昨天  
十点读书  ·  成熟女人,会为自己的选择买单 ·  昨天  
新京报书评周刊  ·  英国社会学家麦克·布洛维逝世,享年78岁 ·  5 天前  
51好读  ›  专栏  ›  吉时通信

【国盛通信】DeepSeek:模型效率的革命,算力基建的新起点

吉时通信  · 公众号  ·  · 2025-02-04 11:23

正文

摘要

【我们团队对于DeepSeek理解,可以用一个非常巧妙的比喻来概括:内燃机效率的提高,一定会带来更大的石油消耗】


DeepSeek做了什么:


【1】验证了新的Scaling Law: 在过去的几年间,AI模型的增长主要依靠于预训练阶段的规模堆积,通过对人类已有数据的不断积累,从而增加模型的规模和能力。但随着训练耗尽了人类已有数据,叠加合成数据之路所产生的幻觉和边际收益递减问题,预训练阶段的Scaling Law逐渐放缓。2024年以来,基于强化学习的新Scaling   Law成为了行业重点方向,先后涌现出了GPT-o1,Deepseek R1等优秀模型。RL这种新的AI增长曲线,在初期展现出了非常高的投入性价比,这也是Deepseek V3快速进化到R1,并展现出强大能力的根本原因。当下RL依然是基于传统的预训练模型,在推理阶段加入RL使得模型面对理科问题时的推理技能更加强大。展望未来,随着RL算法在预训练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,基于RL算法训练模型生成思维链,将共同构成AI新的Scaling   Law,算法创新与算力堆叠在这条曲线上将一起狂奔,AI的能力边界将迎来新一轮的扩张。


【2】极致的工程优化: DeepSeek的真正创新之处在于极致的工程优化,主要依靠了如键值缓存,创新型的MoE架构,以及基于PTX层汇编语言实现对于英伟达GPU效率的极致压榨等等,通过这些创新性的工程优化,使得DeepSeek打破了西方模型公司固有的降本周期曲线,能够用更低的价格,来提供接近头部模型的使用体验,提高了全球算力的使用效率。


【3】慷慨的开源: 与西方以OAI和Anthropic为代表模型巨头,逐渐走向闭源的模型商业理念不同,DeepSeek将自身创新性原理和模型进行了开源,一方面使得全球模型厂商能够共享新的工程方法带来的性价比提升,另一方面使得全球用户能够本地或者通过公有云部署,从而避免高溢价,这也是Deepseek在全球开发者中获得如此高殊荣的核心原因。


DeepSeek对于英伟达的影响:


Deepseek的出现,让全世界看到AGI的实现又更近了一步。我们认为,海外在算力领域的布局不会因为deepseek有所放缓,相反,因为deepseek的出现,将会给全球科技巨头进一步上紧发条,海外科技巨头们将进一步加码在算力领域的布局。具体而言,一方面可能会进一步加大英伟达GPU采购力度,另一方面也会加紧推进自研ASIC方案的进度。此外,美国政府可能会进一步加紧芯片出口限制,试图在算力层面上进行最后的封锁,以限制其他国家地区的AI发展,维护其所谓的AI领先地位。

对于英伟达而言,我们认为,deepseek的阶段性胜利,将继续推动算力市场的整体需求,长期的天花板进一步被打开,我们不认为英伟达的需求和订单会出现任何大幅度的影响,相反,一方面可能会进一步超预期,另一方面英伟达可能也会将其下一代产品的迭代速度加速,性能有望实现重大突破的极具创新型技术路线(如CPO、OIO等),我们认为有望继续提速。我们认为英伟达的股价下跌并非反应的是需求的变化,而更多应是担心可能发生的进一步加紧的芯片出口限制而带来的不确定性。


DeepSeek对于中国算力投资的影响


【对于国产算力】: DeepSeek推出后,美国迫于竞争压力,对于中国进一步加强算力制裁的呼声愈发强大。同时由于DeepSeek开源和低成本特性,国产显卡用于推理的性价比和ROI急剧上升,至此,基于中芯国际的制造能力,芯片厂商的设计能力,Deepseek模型的应用能力三者合一,中国算力自主可控的飞轮开始旋转。


【对于边缘侧】: DeepSeek对于边缘侧的拉动主要有两点,第一是云端先进模型的价格降低,使得AI应用,AI硬件的使用和开发运营成本降低,这将促进AI硬件的放量。第二是DeepSeek对于小模型优化的能力,此次Deepseek也基于Qwen与Llama发布了部分优化后的小模型,能力相较于此前小模型有一定提升。我们认为,随着RL这一新增长曲线的不断放量,叠加边缘侧算力的提升,边缘推理将加速变为现实,边缘算力有望加速放量。


Deepseek对于全球算力投资的影响:


1、GPU: 我们认为deepseek对GPU的影响是积极的,因为目前无论从训练还是推理的角度,GPU的优势的非常明显,算力长期来看依旧将继续指数级增长,我们依旧看好英伟达在AI基础设施领域的确定性优势,同时看好其在能够大幅度提升性能的新技术领域的加速,看好CPO、OIO的加速落地,建议关注:天孚通信、康宁、太辰光等。


2、ASIC: 强化学习对推理的积极影响,可能会加速大模型团队及云厂商对于推理以及自研算力的需求和进展,最终市场取决于单位算力成本的比较,目前来看英伟达在推理领域依旧有着明显的优势,但云厂商可能会继续冒着支出更多的代价,坚定推进自研算力。利好云厂商的ASIC合作伙伴,以及其配套产业链:博通、amd、mrvl、arista、cls、中际旭创、新易盛、cohr、lite等。


3、通信: deepseek对通信的影响比较综合,通常训练集群通信要求相较于同等规模的推理集群更高,但考虑到性价比问题,目前众多训练集群也兼顾了推荐算法、推理、科研、金融交易等其他功能,我们认为训练集群依然将坚定的向着规模更大的方向发展。同时,推理需求需要考虑规模效应,预计云厂商主导的推理市场依旧将占主导地位,端侧目前算力有限,不构成太大影响,预计推理集群也将延续过去发展趋势。综合来看,无论是训练还是推理,依旧将使用到更多的高端交换机和光模块,我们倾向于推荐产品有优势、在手订单充足、产能扩展顺利的标的,建议关注:博通、arista、cls、中际旭创、新易盛、cohr、lite、ciena、德科立。


4、能源: 海外能源相关配套差,我们预计deepseek的出现,将坚定海外科技巨头加速加码布局基础设施的决心,能源领域继续看好整个方向,建议关注:SMR、OKLO、威腾电气,电工合金。


总结来看,对于节后A股的思考:

春节假期中,除了DeepSeek之外,还发生了北美关税落地,芯片制裁进一步加严等事件。结合市场对于DeepSeek的边际变化的认知更多反应在应用端的快速放量上,因此节后主要的进攻方向主要聚焦在端侧以及国产替代链上,而从中长期来看,通信、能源等全球算力配套产业链也将迎来全新的发展期。


节后方向:
端侧:物联网模组龙头,美格智能,移远通信,广和通
国产替代:寒武纪-U,中芯国际,中兴通讯


建议关注:

算力——

光通信: 中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。 铜链接: 沃尔核材、精达股份。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪、海光信息。 液冷: 英维克、申菱环境、高澜股份。 边缘算力承载平台: 美格智能、广和通、移远通信。 卫星通信: 中国卫通、中国卫星、震有科技、海格通信。

数据要素——

运营商: 中国电信、中国移动、中国联通。 数据可视化: 浩瀚深度、恒为科技、中新赛克。


风险提示: AI发展不及预期,算力需求不及预期,市场竞争风险。


1.    投资策略:DeepSeek—模型效率的革命,算力基建的新起点

本周建议关注:


算力——

光通信: 中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。

铜链接: 沃尔核材、精达股份。

算力设备: 中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。

液冷: 英维克、申菱环境、高澜股份。

边缘算力承载平台: 美格智能、广和通、移远通信。

卫星通信: 中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。


数据要素——

运营商: 中国电信、中国移动、中国联通。

数据可视化: 浩瀚深度、恒为科技、中新赛克。


本周观点变化:

本周受Deepseek出圈影响,国内外算力市场均出现大幅波动。国内多支相关个股跌停,海外AI基础设施板块巨震后,英伟达走势最弱,而博通、arista、mrvl、cls、lite、cohr、credo等代表的非nv算力产业链均出现不同程度的回暖。我们认为,节后主要的进攻方向主要聚焦在端侧以及国产替代链上,而从中长期来看,通信、能源等全球算力配套产业链也将迎来全新的发展期。

2. 行情回顾:通信板块下跌,光通信表现最优

本周(2025年1月27日)上证综指收于3250.60点。各行情指标从好到坏依次为:上证综指>沪深300>万得全A>万得全A(除金融,石油石化)>中小板综>创业板综。通信板块下跌,表现劣于上证综指。



从细分行业指数看;运营商上涨1.8%;卫星通信导航、物联网、移动互联、区块链、通信设备、云计算分别下跌2.1%、2.7%、3.0%、3.2%、3.25%、3.3%,表现优于通信行业平均水平;量子通信、光通信分别下跌4.5%、7.9%。


本周,受益于AI智能体概念,拓尔思上涨17.794%,领涨版块。三变科技上涨9.984%;浙江东方上涨9.935%;受益于家庭医生概念,ST易联众上涨5.502%;受益于AI智能体概念;*ST信通上涨5.054%。


3.春节专题1:DeepSeek—模型效率的革命,算力基建的新起点

【核心的一句话:内燃机效率的提升,将带来更多的石油消耗】


我们在首页中已经较为详细的阐述了DeepSeek给全球模型界带来的趋势性变化,在基于RL的新增长曲线,开源带来的全球使用部署热潮下,我们认为算力将在训练与推理的新一轮增长中迎来新的繁荣。


首页中提到,DeepSeek主要的创新来自于工程实现优化,其中包括了创新性MOE,PTX语言等等等等。我们在正文中就一些方面进行简单展开。


在训练原理层面,DeepSeek-R1-Zero模型创新性的跳过了SFT阶段,仅仅使用RL

,使得训练过程进一步简化。DeepSeek-R1-Zero创新性的引入了GRPO算法,使得模型冷启动时能够跳过supervised data,从而能够节省训练成本。




第二,通过使用PTX语言,使得在训练与推理过程中,对于英伟达GPU的性能利用更为高效。英伟达的Cuda体系大体上可以分为三层,第一层为Cuda层,第二层称为PTX层,第三层则为机器码,对应到我们传统编程语言中的“高级语言、汇编语言、机器码”在开发时,Cuda层可以调用函数,利用已有算力,简化流程,因此更加简单,但是无法实现对于GPU的精确控制,PTX则可以深入源头,对于GPU实现更加精确的控制,从而有效提高算力的利用效率。在训练V3模型时,DeepSeek对英伟达H800 GPU进行了重新配置:在132个流处理器多核中,划分出20个用于服务器间通信,主要用于数据压缩和解压缩,以突破处理器的连接限制、提升事务处理速度。




第三,继续保留了DeepSeek V3优秀的MOE架构,使得推理时能够更加精准的调用对应的专家参数,进一步提高了模型的性价比。DeepSeek-V3的设计理念是,通过智能地选择激活哪些参数,而不是盲目地激活所有参数,从而实现了在有限的计算资源下,实现最优的表现。这种方法不仅提高了计算效率,也使得DeepSeek-V3能够在处理复杂任务时,表现出更高的性能。


在此基础上,DeepSeek-V3的MoE设计还具有出色的可扩展性。这一设计通过整合不同领域的“专家”,实现了模型的灵活扩展,无需将所有模型紧密集成在一起。通过这种模块化的设计,DeepSeek-V3能轻松地进行规模扩展,同时还能灵活地适应新的需求和挑战。这种模块化的设计方式,使得DeepSeek-V3能够根据需要,快速增加或减少“专家”,以适应不同的任务和环境。



第二部分,我们对于摘要中关对于A股投资部分进行展开。我们认为,在DeepSeek带来的全球算力新周期下,A股中的算力板块将会迎来新一轮的上行大Beta。其中国产算力,边缘侧算力,算力基建板块是我们建议优先关注的方向。

从国产算力板块来说,在DeepSeek推出后,我们认为,由中芯国际的制造能力,设计公司的计算能力,以及Deepseek为代表的新一代开源模型带来的商用能力,三者共同构成国产算力的飞轮已经完全建立。


同时,在DeepSeek发布后,北美对于加码芯片封锁的意愿愈发强烈。Anthropic CEO发文强调必须加强封锁。长期趋势下,算力国产化比例提升是中美AI军备下的必然趋势,而DeepSeek则加速了这一进程。


我们认为,从国内来看,GPGPU依然是最适合国内需求的芯片构型。一方面DeepSeek采用PTX汇编语言,先前ASIC多只对英伟达的cuda层做了一站式的complier与assmbler软件,现在兼容PTX语言需要更长的适配时间,从北美当下情况来看,类似Groq等主流ASIC云都只上线了70B版本的蒸馏模型,迟迟未能部署671B的完整版R1,这也一定程度上体现了ASIC对于新范式下模型的适配难度。而GPGPU由于天生构型与英伟达类似,对于相对应的语言转变有更加灵活的适应能力。另一方面,DeepSeek的出现,也代表了算法变化成为了大模型进化路上的关键一环,而对于不同算法的灵活适应,也是GPGPU的核心优势。



对于边缘侧来说,Deepseek带来的变化主要有两点,第一是云端先进模型的价格降低,使得AI应用,AI硬件的使用和开发运营成本降低,这将促进AI硬件的放量。第二是DeepSeek对于小模型优化的优化能力。此次Deepseek也基于Qwen与Llama发布了部分优化后的小模型,能力相较于此前小模型有一定提升。我们认为,随着RL这一新增长曲线的不断放量,叠加边缘侧算力的提升,边缘推理将加速变为现实,边缘算力有望加速放量。


4.   春节专题2:如何看待DeepSeek对英伟达以及算力产业链的影响

Deepseek自全球出圈后,美股算力板块迎来巨震,AI基础设施板块中,英伟达走势最弱,而博通、arista、mrvl、cls、lite、cohr、credo等代表的非nv算力产业链均出现不同程度的回暖。我们发现市场普遍担心由于训练成本的大幅度下降,导致训练相关算力未来需求可能会出现疲软,而英伟达在训练领域优势最为明显,这无疑削弱了英伟达的竞争力。另一方面,随着强化学习在推理领域的scaling law效应的进一步体现,市场可能更加关注推理算力未来的增量,而推理相较于训练要求会有所降低,市场的选择可能会更多,这进一步加剧了市场对英伟达的担心。


但更深层次,我们应该注意到,随着deepseek的开源,众多团队迅速根据其论文复现成功,对全行业水平的提升贡献巨大,以openai为首的闭源模型面临了开源模型最直接的冲击:用户大量涌入开源模型app,开发者争先尝试开源模型,云厂商迅速在公有云平台部署deepseek的开源模型,以此来继续抢占用户。Deepseek的重磅开源,某种意义上实现了技术平权,而竞争对手们也会迅速参考其优秀的方法思路去优化自身模型,驱动了全球大模型的进步,对社会的影响巨大深远。


我们应该意识到,大模型的差距正在缩小,公开论文、开源模型以及人才的流动,使得好的工程方法和创意思考在不同的组织内流动并实施落地,未来开源和闭源之间的竞争会更加激烈,token的价格会进一步下降,用户则充分受益于竞争,能够以更低的成本甚至是0成本获取到高质量模型,进而继续拉动token的需求量。Deepseek自出圈后用户量暴增导致服务经常性崩溃,云厂商基于其提前部署的算力,迅速的抢占流量和用户,应用的持续升级,将进一步拉动需求的指数级放量,可以预见算力依然将持续成为最核心的竞争和门槛。


我们从本周微软和meta的财报可以看到,云厂商在AI基础设施的投入上没有任何放缓的迹象,相反,基于算力建立的壁垒甚至正在变得更高:


1、Deepseek的算力集群,放在世界范围内也算比较领先的,如果没有超前的眼光部署算力基础设施,就不会有deepseek。


2、模型层面的差距变小,将进一步推动巨头在算力领域的竞争,谁先抢占到最优质的算力卡,谁先搭建更大效率更高的超算集群,谁就更有可能领先竞争对手。


3、推理需求正在变得更大,拥有更高效率的推理算力的厂商,能更好的满足用户指数级爆发的需求,就会更有先机赢在未来。


deepseek的出现,让全世界看到AGI的实现又更近了一步。我们认为,海外在算力领域的布局不会因为deepseek有所放缓,相反,因为deepseek的出现,将会给全球科技巨头进一步上紧发条,海外科技巨头们将进一步加码在算力领域的布局。具体而言,一方面可能会进一步加大英伟达GPU采购力度,另一方面也会加紧推进自研ASIC方案的进度。此外,美国政府可能会进一步加紧芯片出口限制,试图在算力层面上进行最后的封锁,以限制其他国家地区的AI发展,维护其所谓的AI领先地位。


对于英伟达而言,我们认为,deepseek的阶段性胜利,将继续推动算力市场的整体需求,长期的天花板进一步被打开,我们不认为英伟达的需求和订单会出现任何大幅度的影响,相反,一方面可能会进一步超预期,另一方面英伟达可能也会将其下一代产品的迭代速度加速,性能有望实现重大突破的极具创新型技术路线(如CPO、OIO等),我们认为有望继续提速。我们认为英伟达的股价下跌并非反应的是需求的变化,而更多应是担心可能发生的进一步加紧的芯片出口限制而带来的不确定性。


具体到整个算力产业链,我们认为deepseek带来的影响整体偏积极,其中


1、GPU: 我们认为deepseek对GPU的影响是积极的,因为目前无论从训练还是推理的角度,GPU的优势的非常明显,算力长期来看依旧将继续指数级增长,我们依旧看好英伟达在AI基础设施领域的确定性优势,同时看好其在能够大幅度提升性能的新技术领域的加速,看好CPO、OIO的加速落地,建议关注:天孚通信、康宁、太辰光等。







请到「今天看啥」查看全文