蛇年第一天,DeepSeek 带给硅谷科技圈的影响还在持续。昨天 OpenAI CEO Sam Altman 连发多条推文谈对 DeepSeek 的看法,直言 R1 是一款令人印象深刻的模型,但也表示比以往任何时候都更需要更多的计算能力来实现 AGI 使命。今天 OpenAI 首席研究官 Mark Chen 更是发表了一个更重磅的观察,他认为 DeepSeek 独立发现了 o1 模型的一些核心思路。OpenAI 高管接连对一款中国大模型进行评价,这在大模型爆发的这两年都比较罕见。我们也让 DeepSeek R1 解读一番 Sam Altman 和 Mark Chen 对自己的看法。(不得不说光看 R1 的分析思路已经是一个不错的研究员)与此同时,一些诡异的故障也开始在 DeepSeek 出现,官网显示其线上服务受到大规模恶意攻击。奇安信安全专家表示,1 月 27 日和 1 月28日攻击数量激增,并且攻击手段也再次升级,主要是暴力破解攻击,与此前的 DDos 攻击有明显不同,并且攻击 IP 全部来自美国。如何解读 Sam Altman 对 DeepSeek 的看法Altman 的态度并非单纯礼貌性恭维,而是基于 OpenAI 的底层战略:开放性:欢迎竞争以扩大 AI 应用生态,但前提是 OpenAI 仍主导核心技术创新;防御性:通过 AGI 叙事和算力壁垒,构建竞争对手难以复制的「技术代差」;主动性:加速模型发布与技术展示,保持市场关注度与开发者黏性。简言之,他对 DeepSeek R1 的认可是一种「降维打击式」的自信——承认局部创新,但坚信自身定义全局规则的能力。这种态度既是对行业趋势的精准回应,也是 OpenAI 维持领导地位的心理战策略。 1. 性价比突破Altman 特别强调 R1 的「令人印象深刻」之处在于其「价格与性能的平衡」。根据搜索结果,R1 的 API 价格仅为 OpenAI o1 模型的 1/30(每百万 token 2.19 美元 vs. 60 美元),但其推理能力在数学(如 AIME 测试)、代码生成等领域已接近 o1 的水平。这种成本优势源于其创新的训练方法:例如,港科大团队仅用 7B 参数的模型和 8000 个数学示例,便通过强化学习实现了与大型模型相当的推理能力。Altman 的认可暗示,低成本技术路径的可行性已被验证,但 OpenAl 并未将其视为威胁核心竞争力的关键。2. 技术路径的差异化Altman 并未直接评价 R1 的技术细节,但从其「下一代模型将令人惊叹」的表述可推测,OpenAI 认为自身技术路线(如 AGI 探索)与 R1 的「效率优先」策略存在差异。例如,R1 依赖强化学习与规则奖励机制简化训练流程,而 OpenAI 的 o3 模型已展示出对复杂科学问题的博士级解决能力(准确率 87.7%),更强调能力的泛化与深度。1. 竞争态度的转变Altman 称「新竞争对手的加入令人振奋」,这与 OpenAI 过往对开源模型的谨慎态度形成对比。这一转变或源于 R1 带来的行业变革:其开源策略(如模型权重开放)已催生 500 多个衍生项目,下载量达数百万次,甚至导致部分 OpenAI 用户转向其平台。Altman 的回应既是对市场压力的承认,也暗示 OpenAI 将通过技术壁垒(如 AGI 布局)而非价格战应对竞争。2. 对行业生态的连锁影响R1 的发布引发美股 AI 产业链震荡(英伟达股价暴跌 17%),反映出市场对「算力需求可能降低」的担忧。然而,Altman 强调「计算能力比以往任何时候都更重要」,表明 OpenAI 仍将依赖算力密集型技术路线(如更大规模的预训练)。这种矛盾折射出行业的两极分化:开源生态追求效率,闭源巨头押注技术纵深。1. 强化技术领导地位Altman 明确表示「将推出更好的模型」并「加快发布进度」,这可能是对 R1 的直接回应。例如,OpenAI 在 R1 发布后迅速宣布向免费用户开放 o3-mini 的访问权限,试图通过降低准入门槛维持市场份额。同时,其「继续执行研究路线图」的表述指向 AGI 目标,暗示未来模型将更注重能力的广度(如跨领域推理)而非单纯效率优化。2. 对算力需求的重新定义Altman 强调「需要更多计算能力完成使命」,这与 R1 展示的「小模型高效训练」形成对比。OpenAI 可能认为,AGI 的实现仍需依赖超大规模算力(如万卡集群),而非算法优化。这种观点得到英伟达的支持——其发言人指出,R1 的推理仍需「大量 GPU 支持」,间接为算力需求辩护。1. 技术民主化的加速R1 的成功证明,通过算法创新(如强化学习规则奖励机制),中小团队也能以低成本实现高性能模型。港科大、UC 伯克利等开源项目已验证其核心方法,甚至 1.5B 参数的小模型已展现自我验证能力。这种趋势可能削弱巨头垄断,推动 AI 应用层创新爆发。2. 闭源与开源的长期博弈Altman 对 R1 的认可,实则是对开源生态崛起的策略性回应。OpenAI 选择保持闭源以保护技术优势(如 o3 的 AGI 潜力),而 R1 通过部分开源吸引开发者生态。这种分化或催生两种技术范式:开源社区主导的垂直领域优化 vs. 闭源巨头主导的通用能力突破。关注 AI 第一新媒体,获取 AI 最新资讯和洞察
Mark Chen的评论既是技术层面的肯定,也是竞争态势的宣示:认可:DeepSeek通过独立创新在推理模型领域达到国际顶尖水平,并验证了开源与低成本路线的可行性。竞争:OpenAI仍将押注技术深度(如AGI广度)与生态整合,认为长期竞争力来自「不可复制的核心突破」,而非短期成本优势。行业趋势:这场对话折射出AI行业的两大方向——开源模型的普惠化与闭源模型的技术纵深,两者或将共同推动AI向更高效、更智能的方向演进。1. 技术独立性与创新性Mark Chen祝贺DeepSeek开发出与OpenAI o1同级别的推理模型(如R1),并强调其「独立发现」了与o1开发过程中相似的核心技术思路。这暗示DeepSeek在推理模型的底层逻辑(如强化学习、数据蒸馏技术)上与OpenAI存在技术路径的趋同性。例如,DeepSeek R1通过直接应用强化学习(无需监督微调)和高效数据蒸馏,显著降低了训练成本,同时在数学、代码等推理任务中达到或超越o1的表现。技术对标:DeepSeek R1在AIME数学测试中得分率略高于o1(79.8% vs. 79.2%),且训练成本仅为OpenAI的十分之一,体现了其技术创新与工程优化能力。2. 蒸馏技术的成熟与局限性Mark Chen提到「成本优化与能力提升逐渐解耦」,即通过蒸馏等技术降低服务成本(如DeepSeek的API价格仅为OpenAI的1/30)并不意味着模型能力的绝对提升。这一观点既承认了DeepSeek在成本控制上的成功,也暗示OpenAI认为其自身的技术路线(如推理的Scaling Law)更可能突破能力上限。例如,OpenAI的o3模型已在复杂科学问题中超越人类专家,而DeepSeek尚未达到这一深度。1. 开源与闭源的博弈DeepSeek的开源策略(如R1模型完全开放)对OpenAI的闭源商业模式构成挑战。Mark Chen的评论可视为对开源生态崛起的回应。例如,Meta等公司因担心Llama 4落后于DeepSeek而加速研发,而OpenAI则通过强化技术壁垒(如推出o3模型)和生态整合(如与苹果合作)巩固优势。
- 市场影响:DeepSeek的低成本开源模型已吸引大量开发者,甚至导致部分OpenAI客户转向其平台。2. 推理能力的竞争焦点OpenAI通过o系列模型定义了「推理时代」的技术范式(如思维链分解与强化学习),而DeepSeek的追赶表明行业正从「参数规模竞赛」转向「推理效率优化」。Mark Chen的言论暗示,OpenAI仍将专注于通过更复杂的研究(如AGI的广度泛化)保持领先,而非单纯比拼成本。1. 长期技术路线的信心Mark Chen强调OpenAI将继续推进研究路线图,并计划推出「更好的模型」。这指向其核心战略:通过技术深度(如o3的AGI潜力)而非成本优势巩固地位。例如,o3在博士级科学考试中准确率达87.7%,远超人类专家,而OpenAI认为此类能力泛化至日常场景才是AGI的关键。2. 成本优化的务实态度尽管OpenAI承认需降低服务成本(如o3的高计算费用仍是落地障碍),但其更关注「能力提升」与「商业闭环」的结合。例如,通过强化微调功能吸引企业开发者,而非直接参与价格战。很多用户已经发现,与 DeepSeek 沟通的提示词策略和之前和 ChatGPT 等 AI 已经有所不同,可以更简单直接,欢迎大家在留言区分享使用 DeepSeek 的小技巧。最后祝大家蛇年大吉,巳巳如意