专栏名称: 软件定义世界(SDX)
软件定义世界, 数据驱动未来。
目录
相关文章推荐
数据派THU  ·  【博士论文】面向数据的语言生成模型研究 ·  21 小时前  
CDA数据分析师  ·  【数说年货】2025春节年货购买6大新趋势 ·  3 天前  
软件定义世界(SDX)  ·  美国总统签署加密货币行政令-发展加密货币 ... ·  3 天前  
软件定义世界(SDX)  ·  智源研究院:2025十大AI技术趋势 ·  5 天前  
51好读  ›  专栏  ›  软件定义世界(SDX)

这篇对 DeepSeek 的分析:获马斯克点赞

软件定义世界(SDX)  · 公众号  · 大数据  · 2025-01-29 06:00

正文

热门下载(点击标题即可阅读全文)

【PPT下载】中国数据分析师行业峰会精彩PPT下载(共计21个文件)

【PPT下载】2023中国企业数字化转型最佳实践案例高层论坛精彩PPT下载(共计15个文件)

数字化转型专题:

【战略】企业数字化转型战略完整指南

【PPT】《数字化转型工作手册》
【战略】普华永道:企业如何进行数字化战略转型
【路径】数字化转型知识:架构、价值及路径
【能力】一文读懂企业数字化转型能力框架
【报告】《企业数字化升级之路——百家企业数字化转型发展分析报告》
【本源】数字化转型的本质(10个关键词)

【教训】麦肯锡:企业数字化转型失败率高达80%
【中台】数据中台唱衰,企业数字化转型路在何方?(上、下)
【金融】中国商业银行数字化转型调查报告
【人才】数字化转型中的人才技能重建
【组织】传统企业数字化部门在数字化转型中的重要性及参考设置
【PPT】指标驱动,数据优先、工业数字化转型的经验分享
【华为】华为的字化转型方法论

【华为】华为数字化转型中的数据治理实践[]

【PPT】《华为数据之道》读书笔记

【PPT】《华为数字化转型之道》读书笔记

【案例】国资委:国有企业数字化转型百大典型案例

【困境】国企数字化转型六大困境+原因剖析+典型事件

【路径】2021国有企业数字化转型发展指数与方法路径白皮书

【工业】56万台卡特彼勒设备如何实现“卡特智能”?数字化转型对中国工业互联网的启示

【PPT】《2021中国企业数字化转型路径实践研究报告》

【策略】再论数字化转型-转什么,如何转?
【调研】红杉中国:2022企业数字化指南(附:2022版/2021版下载).

【美的专辑】

【美的1】方洪波:美的的数字化转型实践
【美的2】美的:100亿,数字化转型路径与实践

【美的3】美的集团数字化历程与经验总结(2020年)

【美的4】【PPT】美的从“制造”到“智造”的数字化转型之路


获马斯克称赞 “饶有趣味的分析。我所见过的最好的。”,“AI 将无所不在。”

作者:Gavin Baker 是 Atreides Management, LP 的执行合伙人兼首席投资官,该公司专注于技术和消费者公共和私人股本。

DeepSeek r1 具有一些重要的细节。
最重要的莫过于这一点:r1 的推理成本比 o1 低得多,推理效率却要比 o1 高得多,训练费用仅为 600 万美元。r1 每次 API 调用的*使用*成本比 o1 低 93%,可以在高端工作站上本地运行,而且似乎没有遇到任何速率限制,这很不可思议。
简单计算一下,每 10 亿个活跃参数在 FP8 下需要 1GB 的内存,因此 r1 需要 37GB 的内存。批处理大大降低了成本,更多的计算能力增加了每秒 token(词元)数,所以云端推理仍然具有优势。
另外要指出的一点是,这里牵涉真正的地缘政治因素,我认为这在“Stargate”之后发布并非巧合。再见了,5000 亿美元——我们几乎都还没认识你。
真实情况:
1)它在相关 App Store 类别中下载量排名第一。明显领先于 ChatGPT,这是 Gemini 或 Claude 都未能实现的。
2)从质量角度来看,它比肩 o1,但仍落后于 o3。
3)实现了真正的算法突破,使其在训练和推理方面都大大提高了效率。FP8 训练、MLA 和多 token 预测都具有重要意义。
4)很容易验证 r1 训练成本仅为 600 万美元。虽然这在字面上确实如此,但也极具误导性。
5)就连它们的硬件架构也很新颖,值得注意的是它们使用 PCI-Express 进行扩展。
重要细节:
1)根据技术论文,600 万美元并不包括“与前期研究和架构、算法和数据消融实验相关的成本”。这意味着,只有在实验室已经在前期研究上投入数亿美元并且能够访问更大规模集群的情况下,才有可能以 600 万美元的成本训练出 r1 质量的模型。
DeepSeek 显然拥有远超 2048 块 H800 的算力;他们早期的一篇论文提到拥有 10000 块 A100 的集群。
一个同样聪明的团队不可能仅凭 600 万美元就能启动 2000 块 GPU 组成的集群并从头开始训练 r1。
大约 20% 的英伟达收入来自新加坡。尽管他们尽了最大努力,但 20% 的英伟达 GPU 可能并不在新加坡。
2)存在大量的知识蒸馏——也就是说,如果没有无障碍地访问 GPT-4o 和 o1,他们可能无法完成这个训练。
正如 @altcap 昨天向我指出的那样,限制访问前沿 GPU 的渠道却不对中国蒸馏美国前沿模型的能力采取任何措施,这很可笑——显然违背了出口限制的目的。如果可以免费获得牛奶,为什么要买母牛?
结论:
1)降低训练成本可望提高 AI 方面的投资回报率。
2)在短期内,这对训练资本支出或“能源”主题都不会产生积极影响。
3)目前科技、工业、公用事业和能源领域的“AI 基础设施”赢家面临的最大风险是,r1 的蒸馏版本可以在高端工作站(比如 Mac Studio Pro)上边缘端本地运行。这意味着类似的模型将在约 2 年内可以在超级手机上运行。如果推理因“足够好”而转移到边缘端进行处理,我们将置身一个截然不同的世界,到时会有不同的赢家——即我们将见证有史以来最大规模的 PC 和智能手机升级周期。长期以来,计算能力一直在集中化和去中心化之间摆动。
4)人工超级智能(ASI)已经非常接近,但没有人真正知道超级智能的经济回报会是什么。如果一个耗资 1000 亿美元、在 10 万多块 Blackwell 上训练的推理模型(o5、Gemini 3、Grok 4)可以治愈癌症和发明曲速引擎,那么 ASI 的回报将非常高,训练资本支出和能源消耗将稳步增长;戴森球(Dyson Sphere)将重新成为解释费米悖论的最佳理论。我希望 ASI 的回报是高的——那就太棒了。
5)这对于“使用”AI 的公司都非常有利:软件公司和互联网公司等。
6)从经济角度来看,这极大地提升了分发渠道和独特数据的价值——YouTube、Facebook、Instagram 和 X。
7)美国的实验室可能会停止发布其前沿模型,以防止对 r1 至关重要的知识蒸馏,不过在这方面,猫可能已经完全从袋子里跑出来;换而言之, r1 可能足以训练 r2 。
Grok-3 即将发布,可能会显著影响上述结论。
这将是自 GPT-4 以来首次对预训练扩展定律进行的重大检验。就像花了几周时间通过强化学习将 v3 转变为 r1 一样,运行必要的强化学习来提高 Grok-3 的推理能力也可能需要几周时间。
基础模型越好,推理模型就应该越好,因为三个扩展定律是呈倍增的——预训练、后训练期间的强化学习以及推理过程中的测试时计算(与强化学习密切相关)。

Grok-3 已经表明它可以完成超出 o1 的任务——参见 Tesseract 演示——超出多少将变得很重要。用《双塔奇兵》中一个匿名兽人的话来说,“肉可能很快又会重新出现在菜单上”。时间会告诉我们答案,“当事实发生变化时,我改变主意。”

DeepSeek 对原始英文内容的总结:

ChatGPT 总结:


读大数据应用最佳实践案例,赢数字经济未来!

18个行业,106个中国大数据应用最佳实践案例:

(1)《赢在大数据:中国大数据发展蓝皮书》;

免费试读:https://item.jd.com/12058569.html

(2)《赢在大数据:金融/电信/媒体/医疗/旅游/数据市场行业大数据应用典型案例》;

免费试读:https://item.jd.com/12160046.html

本册“微信读书”免费阅读:https://weread.qq.com/web/bookReview/list?bookId=f0532d707159f0dff058c4e

(3)《赢在大数据:营销/房地产/汽车/交通/体育/环境行业大数据应用典型案例》;

费试读:https://item.jd.com/12160064.html

(4)《赢在大数据:政府/工业/农业/安全/教育/人才行业大数据应用典型案例》。

免费试读:https://item.jd.com/12058567.html

或点击“阅读原文”,购买“赢在大数据系列丛书”。

推荐文章


点击蓝色标题即可阅读全文

10万读者睿选2016年TOP1002015年TOP100

CCTV大数据名人讲堂PPT&视频:万亿元大数据产业安全城市】【农业航运】【数据资产变现

DTiii:3352家大数据产业地图PPT及下载】【TOP100】【亿元俱乐部中国大数据行业应用Top Choice 2019】【赢在大数据
数字化转型:工作手册战略路径百家企业零售转型路银行人才组织工业华为
卡特彼勒美的100亿,百丽美的历程美的PPT华为数据之道转型战略毕马威转型方法论阿里方法论
元宇宙:清华大学元宇宙、北京大学元宇宙

 ChatGPT:官方使用手册 15美元使用指南 技术详解 工作原理

数据中台:凯哥八问颠覆数据工程师阿里滴滴数据中台中台报告数据中台建设之道高峰论坛视频回放富国银行和Netflix数据中台 民生银行数据中台

数据资产:德勤阿里数据资产评估,PPT阿里巴巴数据资产管理实践,阿里&毕马威PPT2021数据资产运营白皮书数据资产目录建设之数据分类全解数据资产管理的5个步骤和6个要素普华永道:数据资产化前瞻性研究白皮书【实践】商业银行数据资产管理体系建设实践报告【行业】银行数据资产的数据治理【案例】附表:芝麻信用元素表(DAS)列表及含义


院士:李国杰【(PPT)(全文)】【数据开放】,邬贺铨倪光南【大数据时代)()】,怀进鹏梅宏

大数据100分:【金融】【制造】【餐饮】【电信】【电商】【更多行业大数据应用请点击底部导航栏BD100分】;

大数据/人工智能数据竞赛:Kaggle经验分享NetFlix百万美金】【Kaggle案例】【2017BDCI】【2017BDCI嘉年华2018BDCI嘉年华滴滴算法大赛】

征信:ZestFinance】【BCG】【芝麻信用】;

工业4.0:罗兰·贝格】【安筱鹏

人工智能:阿里&BCG】【埃森哲经济社会】【美国AI国家战略伯努利李开复】【TOP100】【2016中国AI报告】【美国AI国家规划】【深度学习】【人智合一】【人脸识别】【人脸识别企业PK】【无人驾驶】【AI知识体系】【神经网络

区块链:TED视频】【麦肯锡】【毕马威】【高盛】【全球区块链报告

算   法: 【10大经典算法】【推荐算法

数据科学家:13个真实场景数据科学应用案例数据科学家工具包,数据科学家成指南让统计"看得见"21个面试题和答案

可视化:【2017年获奖2014年最佳】【十大标志性作品】【43款工具

PPT:【大数据产业地图】【数据之巅互联网的未来】【软件正吃掉整个世界】【互联网思维】【互联网+】【一带一路】;

VC:【独角兽研究报告】【大数据投资】【2015创投趋势】【2014投资报告】【倒闭教训

人才:【2018BD&人才报告2017BD&人才报告

大数据应用最佳实践案例:18个行业106个案例

BDAI100:大数据AI产业创新与投资百人会(BDAI100),致力推动1000家亿元BDAI企业涌现、推动BDAI与100万亿实体经济的深度融合、加速10万亿数据经济腾飞(简称“BDAI100十百千工程”)

原创:陈新河:万亿元大数据产业新生态软件定义世界,数据驱动未来数据交易互联网+观点】。

专题版本:20220608V3.91

底部新增导航菜单(点击顶部“软件定义世界(SDX)”,点击“进入公众号”,底部菜单栏即出现),下载200多个精彩PPT,持续更新中!

上下滑动查看更多精选专题内容

微信公众号:软件定义世界(SDX)

微信ID:SDx-SoftwareDefinedx

软件定义世界, 数据驱动未来;

❷ 大数据思想的策源地、数字化转型的指南针、创业者和VC的桥梁、政府和企业家的智库、从业者的加油站;

个人微信号:sdxtime,

邮箱:[email protected]

=>> 长按右侧二维码关注。

底部新增导航菜单,下载200多个精彩PPT,持续更新中!