不考虑各类算力冗余。DeepSeek测算每人每天聊1.4句话的背景下,2400w月活仅需要1814张卡,引发了市场对于算力是否仍然紧缺的讨论。通过对论文《DeepSeek-V3 / R1 推理系统概览》的深度解读,我们认为该论文可以更详细的描绘出未来算力的巨大需求:
1)目前DeepSeek的DAU预计超过2400万(2025年2月数据),暂时为计算便捷假设为2400万。未来若全民AI,则活跃用户数有很大提升空间;
2)每个DAU的对话数(次/天):目前测算的是每人每天聊1.4次,若增加到10句、100句,则算力会成倍扩增;
3)当前DeepSeek的推理延迟(decode任务)对输出吞吐约 14.8k tokens/s,仍然有较大提升空间;
4)该测算仅面向DeepSeek一个应用,未来人们一定是面向众多AI应用,算力需求会叠加进而达到较高水平。
因此,我们对长期情况进行假设和测算:考虑到长期内,AI成为各个行业的生产工具和底层能力,在生活、工作的多个方面都将频繁调用AI能力,使用频次等数据大幅提升,在此情况下来测算对应的GPU的需求。应注意的是,目前AI的使用仍以文本对话为主,未来向多模态发展,算力需求也有望大幅提升。
第一,DeepSeek真实的训练、推理成本不应低估。
据DeepSeek V3论文,556万美元的成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。而基于充足前期准备进行正式训练的成本往往都比较低。以同样在2025年1月发布的加州大学伯克利Sky-T1-32B-Preview为例,其正式训练成本仅为450美元,但在数学能力等方面跑分超过OpenAI o1-Preview。
第二,DeepSeek针对算力生态的底层进行优化,有望进一步激发国产算力潜能。
在 DeepSeek-V3 的技术博文中,DeepSeek表示其使用了英伟达的PTX(Parallel Thread Execution)语言,可以更精细地控制GPU之间传输数据、权重和梯度等,进而实现了算力使用效率的提升。对于国产算力,国内头部大模型(以DeepSeek为代表)也有望有较强的能力来进行生态的适配和优化,进而推动国产算力生态持续完善。
目前已有华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、龙芯中科等10多家国产AI芯片陆续宣布适配DeepSeek大模型。
第三,开源叠加成本优化促进AI推理进一步普及,端侧、边缘侧AI推理有望加速发展。
DeepSeek的技术能力在全球范围内处于领先地位,作为AI底座有望进一步加速AI应用、AI Agent等的落地。同时,由于其开源的属性,将进一步实现对国内AI生态的赋能。DeepSeek蒸馏了多个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标OpenAI o1-mini的效果。技术实力强且开源的大模型将更快赋能国内端侧、边缘侧AI推理的发展。
成本的优化也是促进AI推理普及的重要动力。
在《DeepSeek-V3 / R1 推理系统概览》中,DeepSeek R1 的定价:$0.14 / 百万输入 tokens (缓存命中),$0.55 / 百万输入 tokens (缓存未命中),$2.19 / 百万输出 tokens。同时,夜间使用还会有相应折扣。
总结:降低AI行业进入门槛与成本,长期看将推动总需求上升而非下降。
当模型的成本越低,开源模型发展越好,模型的部署、使用的频率就会越高,使用量就会越大。经济学上著名的“杰文斯悖论”提出:当技术进步提高了资源使用的效率,不仅没有减少这种资源的消耗,反而因为使用成本降低,刺激了更大的需求,最终导致资源使用总量上升。因此从更长的周期来看,DeepSeek的发展恰恰会加速AI的普及和创新,带来算力需求、特别是推理算力需求更大量级提升。
科技巨头加码大模型竞争,国民级应用模型使用持续放大算力需求。1)阿里:
2024Q3阿里的资本支出为 318 亿元,同比增长约 260%,环比增长 80%,主要由于云基础设施支出增加。业务布局层面,要在 AI 和云计算的基础设施建设、AI 基础模型平台以及 AI 原生应用、现有业务的 AI 转型升级这三大领域加大投资力度。
2)腾讯:
2月22日消息,腾讯元宝超越豆包,升至中国区苹果免费APP下载排行榜第二。2月21日腾讯AI助手“腾讯元宝”上新,腾讯元宝的DeepSeek能够理解图片信息,在关闭联网搜索后,用户发送任意图片,元宝都能结合图片内容给出自己的分析和理解。在腾讯元宝,用户可以使用DeepSeek-R1满血版、推理模型混元T1进行深度思考,也可通过DeepSeek-V3、腾讯混元Turbo快速输出答案。
除腾讯元宝外,腾讯文档、企业微信也纷纷发力。
1)腾讯文档于2月17日宣布,AI 文档助手正式接入 DeepSeek - R1 满血版模型。接入后,用户在 AI 文档助手中通过简单的模型选择操作,即可轻松使用该模型的强大功能。接入满血版 DeepSeek - R1 模型后,腾讯文档的搜索能力得到极大增强,支持实时联网搜索,涵盖微信公众号、腾讯文库等全网权威信息源,为用户提供更全面、准确的信息支持。2)2月21日,企业微信上线新版本,在 AI 功能方面实现了重大突破,正式发布 “智能机器人”“智能表格 - 客户跟进总结” 等功能,并灰度接入满血版 DeepSeek - R1 大模型。企业微信已全量上线 “智能机器人” 能力,企业在使用时,无需进行复杂的开发流程,仅需简单配置机器人名称、角色,基于 DeepSeek、混元等大模型,即可一键创建专属的企业 “智能机器人”。
Monica.im 研发的全球首款AI Agent产品Manus,不同于传统的ChatBot,Manus是一个真正自主的 AI 代理,能够解决各类复杂多变的任务。
与传统 AI 助手不同,Manus 不仅能提供建议或答案,还能直接交付完整的任务成果。在接收到用户发送的复杂任务指令时,能够将任务分解为多个子任务,无需用户进行额外的提示或干预,自动规划出合理的执行步骤,能在虚拟环境中调用各类工具,来完成编写和执行代码、浏览网页、操作应用等复杂任务。根据公司在官网中公布的GAIA基准测试(评估通用人工智能助手能力的一个国际化基准测试)表现来看,在基础任务的测试中,Manus已经接近人类水平(Manus基任务准确率达86.5%、中级任务为70.1%、高级任务为57.7%,而人类在 GAIA测试中的平均准确率为92%)。
推理算力需求或是最受益方向。
随着Manus推出,AI Agent产品落地迎来更加具象化的产品,而从输出文字内容到直接交付任务结果,对于任务、应用的调用和资源的运用的复杂度都较传统AI应用有明显提升,进而对于算力的需求或迎来显著的提升。我们曾在报告《重视DeepSeek预期差下国产AI算力机会》指出,国内AI应用百花齐放带来的推理算力需求提升,对于国产AI算力是重要利好,AI Agent的快速发展有望带来推理算力需求的持续提升。
DeepSeek等头部模型的发展让AI应用加速落地,AI Agent也将进一步放大推理算力需求,使用量快速提升推动AI算力需求进入从训练推动到推理推动的拐点;DeepSeek针对算力生态的底层进行优化,有望进一步激发国产算力潜能;国民级应用模型使用持续放大算力需求,同时降低AI行业进入门槛与成本长期看将推动总需求上升而非下降,长期看将加速推理算力需求的提升;大国科技博弈大趋势下,AI算力国产化势在必行,国产算力迎来重要发展机遇。
建议重点关注:
1)芯片设计:重点关注寒武纪、海光信息等AI芯片龙头。2)先进晶圆制造:重点关注以中芯国际为代表领军企业。3)AI服务器:浪潮信息、中兴通讯、中国长城、软通动力、紫光股份、中科曙光、工业富联、高新发展、神州数码、拓维信息、烽火通信等。4)国产AI算力液冷:高澜股份、英维克等。5)DeepSeek一体机:科大讯飞、软通动力、浪潮信息、深信服、天玑科技、云从科技、麒麟信安等。