专栏名称: 橘子汽水铺
橘子汽水铺 by orange.ai。 AI创始人, AI投资人,AI产品经理都在关注的AI科技自媒体。 聚焦最有商业价值的AI资讯,分享一线的AI产品经理经验。
目录
相关文章推荐
西安头条  ·  陕西一学校拟晋升 ·  昨天  
西安头条  ·  陕西一学校拟晋升 ·  昨天  
陕西省文化和旅游厅  ·  老陕专享!少华山冬日免票狂欢!一键穿越冰雪秘境→ ·  3 天前  
陕西省文化和旅游厅  ·  老陕专享!少华山冬日免票狂欢!一键穿越冰雪秘境→ ·  3 天前  
航空工业  ·  蹄疾步稳开新局 干字当头谋新篇 ·  4 天前  
51好读  ›  专栏  ›  橘子汽水铺

中国开源,震撼世界:DeepSeek R1 的变革、启示与展望

橘子汽水铺  · 公众号  ·  · 2025-01-27 07:57

正文

今天是龙年的倒数第二天,也是龙年最后一个工作日。

以往的年末,大家逐渐进入过年的气氛里,休息,总结,放松,过年。

今年的年末,却全然不是这幅景象。

DeepSeek R1 成为了现象级的行业焦点,没有人可以忽视它的光芒。

就在刚刚,DeepSeek 冲到了美国区 App Store 第一名。

而排在第二名的是 OpenAI 的 ChatGPT。

这张截图所代表的,是龙年最有历史意义的一个时刻。

DeepSeek 这家有些神秘的公司,注定将成为龙年最精彩的句点。

而我将在这里告诉大家我所知道的关于 DeepSeek R1 的一切。

口碑爆棚,冲向第一

DeepSeek 不仅拿下了 App Store 美国区的第一名,还拿下了中国区第一名。

超越了字节系的豆包和红果,和其他所有应用。

要知道,这是春节前,各家大厂投放集中撒币投放的阶段。

了解这家公司的人都知道,DeepSeek 没有市场部,也没做任何市场投放。

网上出现了一些质疑的声音:这家公司为什么买了这么多水军,到处都在尬吹?

但事实并非如此,这根本不是尬吹,也没有什么水军。

真实的情况,两个字,简简单单:

口碑。

冲刺,靠自己的技术实力,冲到技术最前沿,和 OpenAI 齐头并进。

开源,把行业认知整体拉齐。

然后,得到全世界的尊重和喜爱。

冲破 OpenAI 的阴影

从 ChatGPT 的发布,到现在的两年间,没有一家公司不是活在 OpenAI 的阴影里。

连去年大火的 Claude,在 B 端偷偷吃掉了 OpenAI 10% 的客户之后,也未曾冲到过美国 App Store 排行榜的前十。

而现在,一切都变了。

这一切变化,都要从七天前说起,那天晚上 DeepSeek R1 发布。

来自中国团队的开源模型,R1 效果比肩顶尖闭源模型 o1,而价格却只要其27 分之一。

彻底打破了推理模型价格昂贵的固有印象。

详见文章: 一天两个大新闻,还过不过年了

这个模型不光是指标好,在实际的 AI 编程中效果也非常好。

详见文章: 当 AI 编程遇上 DeepSeek R1

论文里的革命性发现

之后的两天,大家开始看 DeepSeek R1 的论文,发现了一个更神奇的模型 R1 Zero。

R1 Zero 模型创新性地跳过了监督微调 (SFT) 阶段,直接采用强化学习 (RL) 进行训练,这种近乎原始野性的自进化方式,却取得了媲美顶尖模型的效果,令人惊叹。

R1 Zero 模型虽然因为一些原因没有被公布出来,但它的研究结论却是革命性的:

模型的思考能力是可以自我涌现出来的。

在 DeepSeek-R1-Zero 的训练过程中研究员观察到的一个特别有趣的现象,那就是“顿悟时刻”的出现。 如图所示,这个时刻发生在模型的中间版本中。在这个阶段,DeepSeek-R1-Zero 通过重新评估其初始方法,学会为问题分配更多的思考时间。

「等等,等等。等等。这是我可以标记的一个顿悟时刻。

让我们逐步重新评估,以确定是否可以得到正确的总数 · · ·」

研究员激动地写道:“该模型学会使用拟人化的语气重新思考。这对我们来说也是一个顿悟的时刻。也 让我们见证了强化学习的力量和美丽。

X 上的一位之前曾在 Meta Google 做 AI 研究的朋友 Eric Xu ,这样这样评论 R1 Zero 的革命性:

这是一项有哲学意义的工作:思考(或者说意识)真的是一个涌现现象,不是人类特有的,是模型通过针对一个奖励函数学习就能完成的。
这是往 AGI 上重要的一步

我们也可以相信,未来 R1 Zero 这样的纯 RL 模型一定有一天会出来,并且也许会成为未来的新范式。

所以我专门写了一篇文章,向所有人强烈推荐这篇只有 22 页的论文。

详见文章: 自学成才之路,DeepSeek R1 论文解读

开源的胜利

如果说 DeepSeek R1 的发布,意义重大,它证明了 OpenAI 是可以被超越的。

那 DeepSeek R1 的开源,意义就更大了。

它让几乎每家模型公司都可以复现 R1 的方法,并且都有机会超越 OpenAI。

著名投资机构 A16z 的创始人之一 Marc Andressen 评价 R1 ,说它是对世界的珍贵的礼物。

这是开源对闭源的历史上,又一次胜利。

算力限制下的突围

在这次的开源的伟大胜利中,中国的研究员,发挥了至关重要的作用。

在马斯克构建庞大的十万卡集群的时候,DeepSeek V3 仅仅使用了 2048 张卡。

在算力资源紧张,甚至面临算力出口限制的背景下,DeepSeek 的成绩更显得弥足珍贵。

它证明了,即使在资源受限的环境下,中国AI依然能够通过创新和开源,做出世界一流的成果。

中国的AI研究,依然可以为全球AI的发展贡献力量。

为何是 DeepSeek ?

DeepSeek 是相对神秘的一家公司。

在此之前,大家的注意力更多地聚焦在六小虎身上。

大家对 DeepSeek 的了解,大部分源于暗涌的访谈。

文章链接: 中国的AI不可能永远跟随,需要有人站到技术的前沿

能够与 OpenAI 齐头并进的,为什么会是 DeepSeek?

也许我们能从 DeepSeek CEO 梁文锋的访谈中略微看出一二:

这个世界存在很多无法用逻辑解释的事。

如果我们非要去解释,也许可以从中总结为两点:

  1. DeepSeek 靠组织和文化吸引了有才华的年轻人

  2. DeepSeek 靠开源开放吸引了社区的贡献者

那为什么 DeepSeek 能够吸引到这些年轻人和贡献者?

我翻出了去年去杭州和 DeepSeek 交流后所记录下来的笔记,也许也是一个注脚。

DeepSeek R1 对世界的影响

DeepSeek R1 发布两天后,竟然引发了美国科技界的恐慌情绪。

据 Meta 员工在匿名社交平台Teamblind爆料,DeepSeek V3 的出色表现已经让 Meta 内部感到震惊,仅花费550万美元训练成本的模型,性能却超越了Llama 4。

Meta全公司上下都在深入分析V3的技术细节,然而紧随其后的R1发布,更是让Meta感受到了前所未有的压力。


Sam Altman 被迫调整定价策略

第二天,x 上开始有人怀疑 DeepSeek 故意定价这么低,是为了降低 OpenAI 的利润,号召大家不要上钩。

还好美国科技圈大部分还是理智的,有人说R1是开源模型,自己跑一下就知道,它的成本还真就是这么低。

至于 OpenAI,20美金的月会员,一个月只能用200次 o1。

而 DeepSeek R1,同等水平,无限量,免费用。

面对这种情况,美国人也疯狂了。

从斯坦福到麻省理工,DeepSeek R1 都成了研究员的标配。

在英国的帝国理工,DeepSeek 也越来越火。

Sam Altman 急了,宣布即将推出的 o3-mini 可以免费使用,并且 Plus 可以大量使用。

而评论区,则是纷纷对 DeepSeek 表达谢意。

英伟达,或将面临一些冲击

DeepSeek V3 仅用了 2048 张 H800 就完成了训练,这种效率提升使市场质疑未来是否需要大规模采购英伟达高端GPU,导致英伟达股价短期内大跌超3%,市值蒸发超300亿美元。

训练侧似乎并不需要十万卡集群,那推理侧呢?

DeepSeek R1 因为其高性能,可以部署在华为昇腾上,据说很快就会上线。顶级的自研开源模型+自主可控的硬件,就这样终于闭环了。

一直以来在GPU市场与英伟达竞争的AMD,也迅速宣布对DeepSeek R1和V3模型提供支持。

DeepSeek R1论文中还提到了一个值得关注的细节,即通过R1模型蒸馏得到的小模型,其性能也显著超越了同级别模型,这充分展现了端侧模型的巨大潜力。







请到「今天看啥」查看全文