专栏名称: 新行情
做最具价值的商业信息分享平台,商场如战场,掌握新行情。
目录
相关文章推荐
小新说车  ·  问界M8最大的对手,不是理想是它 ·  昨天  
有车以后  ·  13万不到买激光雷达,友商天塌了! ·  昨天  
融媒吴江  ·  突然宣布!大范围裁员! ·  2 天前  
融媒吴江  ·  突然宣布!大范围裁员! ·  2 天前  
宝马客  ·  宝马M5出厂新车有这种涂鸦?真帅! ·  2 天前  
51好读  ›  专栏  ›  新行情

DeepSeek公布运营成本利润,行业大为震惊

新行情  · 公众号  ·  · 2025-03-04 20:30

正文



梁文锋:我们的原则是不贴钱,也不赚取暴利。

出品 | 新行情    作者 | 唐仁

DeepSeek首次披露大模型成本利润率

DeepSeek 再抛出重磅炸弹。

3月1日,DeepSeek首 次发文披露了DeepSeek-V3/R1推理系统的成本和理论收入数据。这也是第一个详细披露了自身成本结构的大模型公司。

图源:微博

DeepSeek 统计了 2 27 24 点至 2 28 24 点的数据,假定 GPU 租赁成本为 2 美元每小时,则可以计算得出运营一天的算力总成本为 87072 美元,约人民币 63 。而如果所有的 tokens 均以 R1 的价格计费来看,则每日总收入将为 562027 美元,约人民币 409 万元, 成本利润率高达 545%

图源:微博


用总收入减去成本,就可以得到净利润 474955 美元。 换言之,理论上 DeepSeek 的每日净利润高达 474955 美元,约人民币 346 万元。

数据一公布,市场瞬间轰动,引发业界广泛讨论,不少业内人士也被震惊。

但是,有一点需要十分注意, 这个净利润必须强调只是理论上的。

为什么呢?

因为这个理论数据实际上是高度简化和理想化的处理结果,实际运营中的问题是更加复杂多样的,因此实际利润与理论数据存在较大偏差。

前不久,DeepSeek就已经宣布下调夜间空闲时段(即北京时间每天00:30到08:30)的API调用价格,DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。

因此,面对外界一片惊叹质疑声,DeepSeek方面出来澄清并表示, 实际上并没有那么多的收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣,所以实际收入低于理论值。

图源:知乎

这也符合 DeepSeek 创始人梁文锋一贯的态度和原则, “我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”

从2月24日到28日,DeepSeek举行了“开源周”,连续放了5天Infra相关的库。事实上,这次的成本披露其实只是DeepSeek开源周第六天的一个惊喜彩蛋,对于市场的绝大多数人来说,利润是最直观最震撼的。

但显然,DeepSeek的开源周为业界带来的震撼也是一个更比一个猛。

下面我们简单了解一下。

第一天, DeepSeek正式发布开源项目 FlashMLA ,是专为Hopper GPU优化的高效MLA解码内核,针对可变长度序列服务进行了优化。

第二天, DeepSeek发布DeepEP ,这是一个专为混合专家系统(MoE)和专家并行(EP)设计的通信库,旨在优化分布式训练和推理中的通信效率。

第三天, DeepSeek发布DeepGEMM ,这是一个专为NVIDIA Hopper GPU优化的CUDA库,专注于FP8通用矩阵乘法,具有简洁、高效、可与专家调优库相媲美的性能。

第四天,DeepSeek主要发布了两个开源项目, 一个是由梁文锋本人亲自参与底层代码的DualPipe ,可用于双向并行计算,有效降低训练时间;另一个是 EPLB ,也叫专家并行负载均衡器,可自动平衡GPU负载,避免部分显卡过载或闲置。

第五天, DeepSeek发布了最后一个开源项目Fire-Flyer File System ,即3FS并行文件系统,是一种高速文件系统,利用SSD硬件协同设计和RDMA高速网络,显著提高数据处理效率。

可以说,DeepSeek这种直白坦诚实属少见,最后甚至公开成本结构,算是给惊喜不断的开源周一个完美收官。

盈利争议致两家AI公司创始人互撕






请到「今天看啥」查看全文