3月1日,DeepSeek在知乎上发表《DeepSeek-V3 / R1 推理系统概览》文章,表明其理论上一天的成本利润率可达545%。
最大程度优化推理系统,理论成本利润率高达545%。据该文章介绍,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现这两个目标,DeepSeek使用了大规模跨节点专家并行(Expert Parallelism / EP)的方法,并通过一系列技术策略如规模化跨节点专家并行、双批次重叠策略、最优负载均衡等方式,最大化资源利用率,最大程度地优化了大模型推理系统,实现了较高的性能和效率。通过时间上的成本控制,DeepSeek表示DeepSeek V3和R1推理服务占用节点上峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,且所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。当然实际情况较理论计算盈利能力会有差距,因为V3定价更低,且收费服务目前仅占一部分,另外夜间也会有折扣。
对算力端影响:长期仍利好算力,头部云厂商持续受益。本次DeepSeek的系列发布活动,充分展示出DeepSeek在有限算力内最大程度利用了GPU的资源,实现了推理效率的大幅提升。我们认为,通过模型和技术能力充分利用算力的资源,不代表所需算力的天花板降低,长期来看,模型能力仍走在“价格成本下降,能力提升”的发展趋势上,模型使用成本的下降、模型性能的提升,都将促使更多场景落地AI应用,这一过程反而将催生更多的算力需求。因此长期来看,我们认为算力端需求仍将持续高景气。具体而言:1)对于公有云:拥有较多云计算资源的头部厂商如互联网大厂,将具备更强的竞争优势,他们可通过错峰调配的方式提高算力资源的利用率,获取更多的收益;2)对于私有云:从数据与过程的安全性角度出发,AI模型的本地化部署需求仍为相当一部分用户的刚性需求,因此私有云产业同样具备一定的投资价值。
对应用端:有望进一步加速推动AI应用落地。我们认为DeepSeek模型及对应技术能力的开源,降低了AI模型能力的落地成本,从而有望真正推动更多的AI应用规模化落地场景,如企业管理端、政务处理端、工艺流管理等,都有望在未来一段时间内出现商业化较好的AI应用。
投资建议:
我们全面看好AI在今年的全面爆发,建议全面关注,把握AI发展机遇。重点标的如下:1)算力端:建议关注浪潮信息、紫光股份、中科曙光、神州数码等;2)模型端:建议关注科大讯飞、商汤等;3)应用端:建议持续关注AI Agent厂商,如金山办公、焦点科技、金蝶国际、明源云、鼎捷数智、彩讯股份、万兴科技、同花顺、汉得信息、新致软件、福昕软件、合合信息、格灵深瞳、云从科技等,智能驾驶如地平线机器人、经纬恒润、德赛西威、中科创达、虹软科技等,具身智能层面:建议关注机器人如索辰科技、能科科技等。
风险提示:
Al等底层技术变革不及预期,地缘局势恶化、科技对抗加剧,下游客户IT支出意愿与力度不及预期,政策落地不及预期等
证券研究报告:
DeepSeek进一步优化推理系统,AI产业再获催化
对外发布时间:
2025年3月4日
报告发布机构:
中泰证券研究所
参与人员信息:
闻学臣 | S0740519090007 | 邮箱:[email protected]