专栏名称: 潇湘晨报
影响湖南 湖南影响
目录
相关文章推荐
湖南日报  ·  刀郎,新身份亮相 ·  昨天  
潇湘晨报  ·  DeepSeek发文,首次披露! ·  2 天前  
新闻株洲  ·  粤港澳大湾区企业家组团来株考察 ·  3 天前  
潇湘晨报  ·  放假通知:连放四天!(不是所有人) ·  3 天前  
51好读  ›  专栏  ›  潇湘晨报

DeepSeek发文,首次披露!

潇湘晨报  · 公众号  · 湖南  · 2025-03-01 15:53

正文

来源 | 第一财经

3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章, 首次公布模型推理系统优化细节,并披露成本利润率关键信息。

文章写道:“DeepSeek-V3 / R1推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

文章还率先披露了DeepSeek的理论成本和利润率等关键信息。 “假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”


推荐阅读


图片






请到「今天看啥」查看全文