刚刚，DeepSeek 首次披露成本利润率！还有大量技术细节

APPSO · 公众号 · app · 2025-03-01 13:48

正文

当人们以为 DeepSeek 开源周已经结束，刚刚 DeepSeek 又掏出了 One More Thing ，首次披露了其模型推理系统的成本利润率：545%，这一惊人数字背后是一系列精心设计的技术优化。

DeepSeek 在保证服务质量的同时，实现了极高的成本效益：

DeepSeek-V3/R1 推理系统面临两大挑战：如何提高吞吐量和如何降低延迟。

他们采用了大规模跨节点专家并行（Expert Parallelism/EP）技术。

DeepSeek-V3/R1 采用了MoE（混合专家）架构，每层有 256 个专家，但每个 token 只激活其中 8 个。这种高度稀疏的结构需要通过专家并行来提高效率：

专家并行就像是把不同特长的厨师分散到多个厨房（GPU）中：

1. 提高吞吐量： 就像餐厅一次接待更多顾客（增大batch size）。当厨房里同时处理很多订单时，厨师们可以更高效地工作，不会有空闲时间，炉灶和切菜台都能充分利用。

2. 降低延迟： 每个厨房只需要专注几种特色菜（每个GPU只计算少量专家），厨师不需要来回切换不同菜系，也不用频繁更换工具和食材，做菜速度自然更快。

DeepSeek 针对不同场景采用了不同的并行策略：

为了提高效率 DeepSeek 还采用了双批次重叠处理负载均衡策略

双批次重叠处理：就像厨师一边炒着这桌的菜，一边准备下一桌的食材。当一批订单在烹饪时，另一批订单的食材可以同时在配送中，这样厨房永远不会空闲。

负载均衡策略：

正因为这些技术优化，DeepSeek 即使在硬件受限的情况下，也能实现出色的推理性能。

卡住它的地方，反而变成了它的创新。

附 DeepSeek 官方原文🔗

推荐文章

APPSO · 实测 GPT-4.5！全网都在喷的 OpenAI 最贵模型，我发现了一个惊喜的点

昨天

小众软件 · 另外两件事[250228]

昨天

APPSO · DeepSeek 开源周最后一天，重塑 AI 训练底层逻辑

昨天

APPSO · OpenAI 官宣，GPT-4.5 即将发布

2 天前

小众软件 · 影响900万用户？VS Code 主题插件 Material Theme 存在恶意代码，已下架。

2 天前

扬子晚报 · 太可怕！你家有这种拖鞋吗？大人小孩都不能穿，赶紧扔了吧！

8 年前

基层麻醉网 · 指南与共识 | 围术期高血压管理专家共识（2016）

8 年前

腾讯财讯 · 揭秘涨停板：新疆板块崛起次新股依旧强势

7 年前

智囊团达人 · 青梅竹马是种什么感受？

7 年前

海报网 · 她们| 世上总有一些人，过着你想要的生活

7 年前