梁文锋:我们的原则是不贴钱,也不赚取暴利。
DeepSeek首次披露大模型成本利润率
3月1日,DeepSeek首
次发文披露了DeepSeek-V3/R1推理系统的成本和理论收入数据。这也是第一个详细披露了自身成本结构的大模型公司。
图源:微博
DeepSeek
统计了
2
月
27
日
24
点至
2
月
28
日
24
点的数据,假定
GPU
租赁成本为
2
美元每小时,则可以计算得出运营一天的算力总成本为
87072
美元,约人民币
63
万
元
。而如果所有的
tokens
均以
R1
的价格计费来看,则每日总收入将为
562027
美元,约人民币
409
万元,
成本利润率高达
545%
。
图源:微博
用总收入减去成本,就可以得到净利润
474955
美元。
换言之,理论上
DeepSeek
的每日净利润高达
474955
美元,约人民币
346
万元。
数据一公布,市场瞬间轰动,引发业界广泛讨论,不少业内人士也被震惊。
但是,有一点需要十分注意,
这个净利润必须强调只是理论上的。
为什么呢?
因为这个理论数据实际上是高度简化和理想化的处理结果,实际运营中的问题是更加复杂多样的,因此实际利润与理论数据存在较大偏差。
前不久,DeepSeek就已经宣布下调夜间空闲时段(即北京时间每天00:30到08:30)的API调用价格,DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。
因此,面对外界一片惊叹质疑声,DeepSeek方面出来澄清并表示,
实际上并没有那么多的收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣,所以实际收入低于理论值。
图源:知乎
这也符合
DeepSeek
创始人梁文锋一贯的态度和原则,
“我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”
从2月24日到28日,DeepSeek举行了“开源周”,连续放了5天Infra相关的库。事实上,这次的成本披露其实只是DeepSeek开源周第六天的一个惊喜彩蛋,对于市场的绝大多数人来说,利润是最直观最震撼的。
但显然,DeepSeek的开源周为业界带来的震撼也是一个更比一个猛。
下面我们简单了解一下。
第一天,
DeepSeek正式发布开源项目 FlashMLA
,是专为Hopper GPU优化的高效MLA解码内核,针对可变长度序列服务进行了优化。
第二天,
DeepSeek发布DeepEP
,这是一个专为混合专家系统(MoE)和专家并行(EP)设计的通信库,旨在优化分布式训练和推理中的通信效率。
第三天,
DeepSeek发布DeepGEMM
,这是一个专为NVIDIA Hopper GPU优化的CUDA库,专注于FP8通用矩阵乘法,具有简洁、高效、可与专家调优库相媲美的性能。
第四天,DeepSeek主要发布了两个开源项目,
一个是由梁文锋本人亲自参与底层代码的DualPipe
,可用于双向并行计算,有效降低训练时间;另一个是
EPLB
,也叫专家并行负载均衡器,可自动平衡GPU负载,避免部分显卡过载或闲置。
第五天,
DeepSeek发布了最后一个开源项目Fire-Flyer File System
,即3FS并行文件系统,是一种高速文件系统,利用SSD硬件协同设计和RDMA高速网络,显著提高数据处理效率。
可以说,DeepSeek这种直白坦诚实属少见,最后甚至公开成本结构,算是给惊喜不断的开源周一个完美收官。