专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
黄建同学  ·  John Rush对24+种AI编码 ... ·  昨天  
爱可可-爱生活  ·  【Let's Build a Simple ... ·  昨天  
爱可可-爱生活  ·  【Claude和o3 ... ·  昨天  
爱可可-爱生活  ·  【Python项目结构优化小技巧】想让Pyt ... ·  昨天  
黄建同学  ·  Y Combinator ... ·  4 天前  
51好读  ›  专栏  ›  黄建同学

Andrew NG吴恩达:DeepSeek 引发的思考:中美 A-20250201154753

黄建同学  · 微博  · AI  · 2025-02-01 15:47

正文

2025-02-01 15:47

Andrew NG吴恩达:
DeepSeek 引发的思考:中美 AI 竞赛、开源趋势与 AI 发展路径的多样性

过去一周,DeepSeek 的发布让许多人意识到了一些一直在悄然发生的重要趋势:

1. 中国正在 AI 领域迅速追赶美国,这对 AI 供应链格局产生深远影响。

2. 开源权重模型正在使基础模型层商品化,为 AI 应用开发者创造了更多机会。

3. AI 进步不仅仅依赖算力扩展,尽管计算能力仍是一个关键因素,算法创新正快速降低训练成本。

大约一周前,中国公司 DeepSeek 发布了 DeepSeek-R1,这是一款表现卓越的模型,其基准测试成绩可与 OpenAI 的 o1 相媲美。此外,该模型采用 开源权重,并以宽松的 MIT 许可证发布。在达沃斯论坛期间,我收到了许多非技术商业领袖的询问,而在周一,美股市场出现了“DeepSeek 抛售潮”,Nvidia 及多家美国科技公司的股价大幅下跌(截至目前,一些股票已有所回升)。

DeepSeek 让人们意识到了什么?

1. 中国正在生成式 AI 领域迅速追赶美国

ChatGPT 在 2022 年 11 月发布时,美国在生成式 AI 方面远超中国。由于人们的认知往往存在滞后性,即便在最近,我仍然听到许多美国和中国的朋友认为中国“仍然落后”。但事实上,过去两年间,中国的 AI 进步迅猛。Qwen(通义千问)、Kimi、InternVL 以及 DeepSeek 等模型的发布,表明中国已经缩小了差距,甚至在视频生成等特定领域,中国已表现出领先优势。

DeepSeek-R1 采用 开源权重 并附带技术报告,详细分享了许多训练细节。这与一些美国公司推动 AI 监管、强调“AI 可能导致人类灭绝”等假设性威胁的做法形成鲜明对比。现在已经很清楚,开源模型是 AI 供应链的重要组成部分,许多企业将依赖这些模型。如果美国继续阻碍开源发展,中国可能在这一领域占据主导地位,导致许多企业使用更符合中国价值观的 AI 模型,而非美国的。

2. 开源权重正在使基础模型层商品化

正如我之前提到的,LLM(大语言模型)推理成本正在快速下降,而开源权重模型正加速这一趋势,为开发者提供更多选择。举个例子,OpenAI 的 o1 价格为每百万输出 token 60 美元,而 DeepSeek-R1 仅为 2.19 美元,这一近 30 倍 的价格差异让许多人开始关注 AI 服务成本的下降趋势。

训练基础模型并依靠 API 访问盈利的商业模式并不容易,许多企业仍在努力回收庞大的训练成本。Sequoia 的文章《AI 的 6000 亿美元问题》很好地概述了这一挑战(但需要强调,我仍然认为基础模型公司在做伟大的工作,我希望它们成功)。相比之下,基于基础模型开发 AI 应用则充满商业机会——现在,由于已有企业投入数十亿美元训练这些模型,开发者可以以极低的成本访问这些模型,并构建 客服机器人、邮件摘要工具、AI 医生、法律文档助手等 AI 应用。

3. AI 进步不仅仅依赖算力扩展

长期以来,“扩展(Scaling Up)”被认为是推动 AI 进步的关键路径,这一理念也曾帮助许多公司筹集了数十亿美元资金。然而,DeepSeek 的出现让人们开始意识到,AI 进步并非仅靠增加计算资源,更精细的优化也能带来突破。

由于美国对中国实施 AI 芯片出口限制,DeepSeek 团队不得不针对 H800 GPU(比 H100 性能较低)进行优化,最终成功在 不到 600 万美元的计算成本下训练出一个高性能模型(不包括研究成本)。

这是否会减少对算力的需求?目前尚未可知。事实上,当单位计算成本下降时,整体算力需求可能反而会上升。从长期来看,我认为 人类对智能和计算能力的需求几乎没有上限,因此即便 AI 变得更便宜,市场对算力的需求依然强劲。

DeepSeek 的发布:技术、地缘政治与商业影响

过去几天,我在 X(Twitter)上看到了许多不同的解读,每个人似乎都能从 DeepSeek 的进展中投射出自己的理解。

我认为 DeepSeek-R1 具有尚待厘清的地缘政治影响,同时对于 AI 应用开发者来说,它是个利好消息。我的团队已经在讨论,如何基于这个开源模型构建以前无法实现的新应用。

现在仍然是 AI 创业的黄金时代,让我们一起见证这个行业的发展!

#吴恩达发文力挺DeepSeek##deepseek智商情商都高##ai创造营#