专栏名称: 闻学臣科技研究
研究成果发布
目录
相关文章推荐
大众新闻-大众日报  ·  消息传来,他已获中国国籍! ·  21 小时前  
大众新闻-大众日报  ·  消息传来,他已获中国国籍! ·  21 小时前  
川观新闻  ·  编制内!成都事业单位公开招聘,正在报名→ ·  23 小时前  
成都本地宝  ·  成都出发坐高铁去看海的6个城市推荐! ·  4 天前  
成都发布  ·  国家出手教减肥!四川人应该这么吃→ ·  3 天前  
51好读  ›  专栏  ›  闻学臣科技研究

DeepSeek进一步优化推理系统,AI产业再获催化【中泰计算机】

闻学臣科技研究  · 公众号  ·  · 2025-03-05 10:59

正文

1

投资事件


3月1日,DeepSeek在知乎上发表《DeepSeek-V3 / R1 推理系统概览》文章,表明其理论上一天的成本利润率可达545%。


最大程度优化推理系统,理论成本利润率高达545%。据该文章介绍,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现这两个目标,DeepSeek使用了大规模跨节点专家并行(Expert Parallelism / EP)的方法,并通过一系列技术策略如规模化跨节点专家并行、双批次重叠策略、最优负载均衡等方式,最大化资源利用率,最大程度地优化了大模型推理系统,实现了较高的性能和效率。通过时间上的成本控制,DeepSeek表示DeepSeek V3和R1推理服务占用节点上峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,且所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。当然实际情况较理论计算盈利能力会有差距,因为V3定价更低,且收费服务目前仅占一部分,另外夜间也会有折扣。



对算力端影响:长期仍利好算力,头部云厂商持续受益。本次DeepSeek的系列发布活动,充分展示出DeepSeek在有限算力内最大程度利用了GPU的资源,实现了推理效率的大幅提升。我们认为,通过模型和技术能力充分利用算力的资源,不代表所需算力的天花板降低,长期来看,模型能力仍走在“价格成本下降,能力提升”的发展趋势上,模型使用成本的下降、模型性能的提升,都将促使更多场景落地AI应用,这一过程反而将催生更多的算力需求。因此长期来看,我们认为算力端需求仍将持续高景气。具体而言:1)对于公有云:拥有较多云计算资源的头部厂商如互联网大厂,将具备更强的竞争优势,他们可通过错峰调配的方式提高算力资源的利用率,获取更多的收益;2)对于私有云:从数据与过程的安全性角度出发,AI模型的本地化部署需求仍为相当一部分用户的刚性需求,因此私有云产业同样具备一定的投资价值。



对应用端:有望进一步加速推动AI应用落地。我们认为DeepSeek模型及对应技术能力的开源,降低了AI模型能力的落地成本,从而有望真正推动更多的AI应用规模化落地场景,如企业管理端、政务处理端、工艺流管理等,都有望在未来一段时间内出现商业化较好的AI应用。



2

投资建议和风险提示




投资建议: 我们全面看好AI在今年的全面爆发,建议全面关注,把握AI发展机遇。重点标的如下:1)算力端:建议关注浪潮信息、紫光股份、中科曙光、神州数码等;2)模型端:建议关注科大讯飞、商汤等;3)应用端:建议持续关注AI Agent厂商,如金山办公、焦点科技、金蝶国际、明源云、鼎捷数智、彩讯股份、万兴科技、同花顺、汉得信息、新致软件、福昕软件、合合信息、格灵深瞳、云从科技等,智能驾驶如地平线机器人、经纬恒润、德赛西威、中科创达、虹软科技等,具身智能层面:建议关注机器人如索辰科技、能科科技等。

风险提示: Al等底层技术变革不及预期,地缘局势恶化、科技对抗加剧,下游客户IT支出意愿与力度不及预期,政策落地不及预期等



证券研究报告: DeepSeek进一步优化推理系统,AI产业再获催化

对外发布时间: 2025年3月4日

报告发布机构: 中泰证券研究所

参与人员信息:

闻学臣 | S0740519090007 | 邮箱:[email protected]







请到「今天看啥」查看全文