Andrew NG吴恩达：DeepSeek 引发的思考：中美 A-20250201154753_黄建同学的专栏文章_微信文章

Andrew NG吴恩达：
DeepSeek 引发的思考：中美 AI 竞赛、开源趋势与 AI 发展路径的多样性

过去一周，DeepSeek 的发布让许多人意识到了一些一直在悄然发生的重要趋势：

1. 中国正在 AI 领域迅速追赶美国，这对 AI 供应链格局产生深远影响。

2. 开源权重模型正在使基础模型层商品化，为 AI 应用开发者创造了更多机会。

3. AI 进步不仅仅依赖算力扩展，尽管计算能力仍是一个关键因素，算法创新正快速降低训练成本。

大约一周前，中国公司 DeepSeek 发布了 DeepSeek-R1，这是一款表现卓越的模型，其基准测试成绩可与 OpenAI 的 o1 相媲美。此外，该模型采用开源权重，并以宽松的 MIT 许可证发布。在达沃斯论坛期间，我收到了许多非技术商业领袖的询问，而在周一，美股市场出现了“DeepSeek 抛售潮”，Nvidia 及多家美国科技公司的股价大幅下跌（截至目前，一些股票已有所回升）。

DeepSeek 让人们意识到了什么？

1. 中国正在生成式 AI 领域迅速追赶美国

ChatGPT 在 2022 年 11 月发布时，美国在生成式 AI 方面远超中国。由于人们的认知往往存在滞后性，即便在最近，我仍然听到许多美国和中国的朋友认为中国“仍然落后”。但事实上，过去两年间，中国的 AI 进步迅猛。Qwen（通义千问）、Kimi、InternVL 以及 DeepSeek 等模型的发布，表明中国已经缩小了差距，甚至在视频生成等特定领域，中国已表现出领先优势。

DeepSeek-R1 采用开源权重并附带技术报告，详细分享了许多训练细节。这与一些美国公司推动 AI 监管、强调“AI 可能导致人类灭绝”等假设性威胁的做法形成鲜明对比。现在已经很清楚，开源模型是 AI 供应链的重要组成部分，许多企业将依赖这些模型。如果美国继续阻碍开源发展，中国可能在这一领域占据主导地位，导致许多企业使用更符合中国价值观的 AI 模型，而非美国的。

2. 开源权重正在使基础模型层商品化

正如我之前提到的，LLM（大语言模型）推理成本正在快速下降，而开源权重模型正加速这一趋势，为开发者提供更多选择。举个例子，OpenAI 的 o1 价格为每百万输出 token 60 美元，而 DeepSeek-R1 仅为 2.19 美元，这一近 30 倍的价格差异让许多人开始关注 AI 服务成本的下降趋势。

训练基础模型并依靠 API 访问盈利的商业模式并不容易，许多企业仍在努力回收庞大的训练成本。Sequoia 的文章《AI 的 6000 亿美元问题》很好地概述了这一挑战（但需要强调，我仍然认为基础模型公司在做伟大的工作，我希望它们成功）。相比之下，基于基础模型开发 AI 应用则充满商业机会——现在，由于已有企业投入数十亿美元训练这些模型，开发者可以以极低的成本访问这些模型，并构建客服机器人、邮件摘要工具、AI 医生、法律文档助手等 AI 应用。

3. AI 进步不仅仅依赖算力扩展

长期以来，“扩展（Scaling Up）”被认为是推动 AI 进步的关键路径，这一理念也曾帮助许多公司筹集了数十亿美元资金。然而，DeepSeek 的出现让人们开始意识到，AI 进步并非仅靠增加计算资源，更精细的优化也能带来突破。

由于美国对中国实施 AI 芯片出口限制，DeepSeek 团队不得不针对 H800 GPU（比 H100 性能较低）进行优化，最终成功在不到 600 万美元的计算成本下训练出一个高性能模型（不包括研究成本）。

这是否会减少对算力的需求？目前尚未可知。事实上，当单位计算成本下降时，整体算力需求可能反而会上升。从长期来看，我认为人类对智能和计算能力的需求几乎没有上限，因此即便 AI 变得更便宜，市场对算力的需求依然强劲。

DeepSeek 的发布：技术、地缘政治与商业影响

过去几天，我在 X（Twitter）上看到了许多不同的解读，每个人似乎都能从 DeepSeek 的进展中投射出自己的理解。

我认为 DeepSeek-R1 具有尚待厘清的地缘政治影响，同时对于 AI 应用开发者来说，它是个利好消息。我的团队已经在讨论，如何基于这个开源模型构建以前无法实现的新应用。

现在仍然是 AI 创业的黄金时代，让我们一起见证这个行业的发展！

#吴恩达发文力挺DeepSeek##deepseek智商情商都高##ai创造营#

Andrew NG吴恩达：DeepSeek 引发的思考：中美 A-20250201154753

正文

2025-02-01 15:47
本条微博链接

请到「今天看啥」查看全文