DeepSeek，首次披露关键数据！

南京新闻 · 公众号 · 科技创业科技自媒体 · 2025-03-02 14:40

主要观点总结

国内AI大模型公司DeepSeek在知乎发布了《DeepSeek-V3/R1推理系统概览》文章，披露了DeepSeek-V3和R1推理系统的核心优化方案、成本利润率和关键数据。DeepSeek使用H800 GPU提供服务，并根据负荷情况调整推理服务节点。DeepSeek还公开了其定价策略、夜间折扣优惠和开源策略等。DeepSeek的开源和透明化策略展示了其技术实力和商业潜力，并向行业传递了AI大模型盈利闭环实现的关键转折信号。

关键观点总结

关键观点1: DeepSeek首次发布《DeepSeek-V3/R1推理系统概览》技术文章

文章公开了DeepSeek推理系统的核心优化方案，披露了成本利润率和关键数据，引发行业震动。

关键观点2: DeepSeek使用H800 GPU提供服务

DeepSeek-V3和R1的所有服务均使用H800 GPU，并根据负荷情况调整推理服务节点部署。

关键观点3: DeepSeek的定价策略和夜间折扣优惠

DeepSeek在官网宣布推出夜间空闲时段的错峰优惠活动，API调用价格大幅下调。此外，DeepSeek的总收入受到定价策略、免费服务和夜间折扣的影响。

关键观点4: DeepSeek的开源策略和成本控制能力

DeepSeek的开源策略展示了其技术实力和商业潜力，并打破了AI领域的资源垄断。其开源成果引发了热烈讨论。

关键观点5: DeepSeek正在研发新的推理模型

外媒透露DeepSeek正在加速研发DeepSeek-R2推理模型，新模型有望生成更好的代码，并使用英语之外的语言进行推理。

正文

国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章，不仅公开了其推理系统的核心优化方案，更是 首次披露了成本利润率等关键数据 ，引发行业震动。

据DeepSeek官方披露，DeepSeek-V3和R1的所有服务均使用H800 GPU。由于服务负荷白天高、晚上低，DeepSeek实现一套机制，在白天负荷高的时候用所有节点部署推理服务，晚上负荷低的时候减少推理节点。

2月27日至2月28日的24个小时内，DeepSeek-V3和R1推理服务占用节点总和，峰值占用为278个节点，平均占用226.75个节点（每个节点为8个H800 GPU）。假定GPU租赁成本为2美元/小时，总成本为87072美元/天。

若所有tokens的输入和输出全部按照DeepSeek R1的定价计算， 理论上DeepSeek一天的总收入为562027美元，成本利润率高达545% 。不过，由于DeepSeek-V3定价低于R1，且网页端和应用程序免费，仅部分服务产生收入，再加上非高峰时段设有夜间折扣，其实际收入不及理论数值。

来源：DeepSeek知乎官方账号

2月26日，DeepSeek在官网宣布，北京时间每日00:30至08:30的夜间空闲时段，DeepSeek开放平台推出错峰优惠活动。在此期间，API调用价格大幅下调：DeepSeek-V3降至原价的50%，DeepSeek-R1更是低至25%。DeepSeek称，鼓励用户充分利用这一时段享受更经济更流畅的服务体验。

“DeepSeek开源周”自2月24日启动，期间DeepSeek陆续开源了众多最新技术进展 ，包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目以及DualPipe、EPLB等代码库。这些开源成果在业内引发了热烈讨论。

业内分析指出， DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断 。DeepSeek此次“透明化”披露，不仅展示了其技术实力与商业潜力，更向行业传递明确信号：AI大模型的盈利闭环已从理想照进现实，标志着AI技术从实验室迈向产业化的关键转折。

据外媒透露，DeepSeek正在加速研发DeepSeek-R2推理模型，这一模型原计划今年5月发布 ，但或许会提前，新模型有望可以生成更好的代码，并且使用英语之外的语言进行推理。

编辑：刘清凝

来源：中国经济网、 DeepSeek知乎官方账号、券商中国