专栏名称: 尹哥聊基因
尹哥,华大集团执行总裁,华大基因副董事长尹烨。妙趣横生聊基因八卦,眼光独到论行业纵横,全新视角话健康医疗。 尹哥聊基因,新鲜、有料、有趣、靠谱的优(feng)秀(sao)科普栏目。
目录
相关文章推荐
51好读  ›  专栏  ›  尹哥聊基因

英伟达一天跌掉5000亿美金,DeepSeek是敲响了AGI的丧钟么?

尹哥聊基因  · 公众号  ·  · 2025-01-30 08:00

正文

请到「今天看啥」查看全文



点击上方蓝字关注“尹哥聊基因”

最近微信改版,容易找不到尹哥的文章,大家记得把尹哥设为星标⭐️ 哦~

DeepSeek 最近全球大热,一夜之间让英伟达市值跌了近17%,创造了历史上科技股单日的最大跌幅。川普更是连夜表态,DeepSeek的出现 “给美国相关产业敲响了警钟” 。也有朋友留言,说话不要说太早,昨晚又涨回来近9%。这么讲也没错,但对美国AI资本市场当下故事的多空分歧已经形成。而 对中国来讲,这可能是个 国运级别的科技成果 ,让我们看到了即使在如此严密的封锁下,依然还有各个维度的突破空间,这个像极了生命演化,所谓“生命总会找到出口”,当然也无需借此将它推上神坛。

其实把DeepSeek推上风口浪尖的,还不是他们自己,而是Meta,也就是之前的Facebook。

几天前,在美国匿名职场社区teamblind上,有Meta员工直言:DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,前者低成本的训练工作,让后者难以解释自己超高预算的合理性。“工程师们正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。”

Meta使用了高算力H100 GPU的Meta Llama 3系列模型, 其计算量足可训练DeepSeek V3至少15次,但是最终表现却不及DeepSeek 。因而,无怪乎Meta科学家田渊栋惊叹DeepSeek V3的训练看上去是黑科技,“这是非常伟大的工作。”

Meta创始人兼CEO 扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI差距非常小 。扎克伯格还表示:中国正在全力冲刺,如果将来有一个开源模型能被全世界广泛使用,我们希望它是一个美国模型。这话讲得够酸的了。

同样的,图灵奖得主,Meta AI首席科学家杨立昆(Yann LeCun)在社交媒体上表示:“当人们看到 DeepSeek的表现,惊呼中国AI正在赶超美国,但这种解读有误。更准确的结论是, 开源模型正在超越闭源系统。

到这一刻,我们或许可以总结一下, DeepSeek赢在了哪里?那就是接地气! 开源以及超高的性价比。

我们知道人工智能三支柱,算法、算力、数据。算力的背后是GPU,目前最强最多的都在美国,但DeepSeek通过模型蒸馏和开源策略,用算法杠杆对抗了算力依赖,以超高性价比优势倒逼技术开源平民化。

至少在这一刻,对于资本市场,是一次估值的重大重构,即把价值中心从硬件层转向算法和应用层。

这种四两拨千斤的方式,像极了抗美援朝志愿军所打出的若干经典战役 ,比如长津湖、上甘岭、铁原阻击战等。既然我暂时无法在先进装备上赢了你,我就把轻步兵的优势发挥到极致,以时间换空间或者以空间换时间,直到我具备战略反攻能力。

所谓 蒸馏法 ,可以理解为是一种讨巧的知识迁移技术,简单理解就是将一个复杂的大模型(教师模型)的知识传递给一个较小的模型(学生模型),从而减少模型的复杂性并降低计算资源的需求,同时保持较高的预测性能‌。

所以此刻,DeepSeek的成功,能够说明标度率没有意义,甚至破产么?很遗憾,并不能。

历史学就是未来学,我们看看汽车,比如当年的福特T型车,通过流水线和质量体系的应用,使得汽车从奢侈品变成了家用品,从而极大地提升了汽车的普及率,但仅追求极致的性价比并不能催生智能汽车的诞生。

从我熟悉的生命演化来看,比如昆虫已经算是无脊椎动物之王了,它们几乎占据了地球的所有角落,高等动物、包括人类根本无法将其消灭,想想蟑螂或者蝗虫可能就明白了。

但这样下去,生命就能一直延续吗?因为地球终将被太阳吞没,要解决这个问题就要星际移民,那么就必须诞生智能、诞生科学,所以物种势必需要向上演化,尤其是中枢神经系统的演化。

所以,脊椎动物出现了,而受到脊索、脊椎保护,中枢神经系统也经过长达6亿年的演化,终于膨大成智慧脑,成就了今日智人之地位,比如正在打字的我和正在看这篇文章的您,以及发明了AI和DeepSeek的团队。

所以,人类依然还需要向上捅破天。其实0-1是最难的,在追求AGI乃至ASI的路上,我相信大模型定律依然有效,辛顿有一句话我非常赞同: 人脑只是特别复杂,但并不特殊。

正如小鼠脑只有7000万个神经元,猴脑则有60亿个神经元,而人脑是860亿个神经元。

如果神经元的叠加可以诞生高级智能,那么GPU的并联也应异曲同工。

所以被誉为美国AI曼哈顿计划的“星际之门”的本质,构建七十万张乃至百万张GPU卡超级AI计算中心的雄伟计划,也是软银和OpenAI在全力下注通用人工智能到超级人工智能,他们希望借此可以牢牢卡住生态位,从而形成飞轮效应的正反馈。

我们必须看到,在大语言模型(LLM)之后,目前在多模态、思维链、空间感知、物理孪生、科学推演等算力都呈现出几何级数的增长。

而DeepSeek爆火之后的一度宕机,除去了黑客攻击要素,也证明了 大算力依然是AI普及、技术平等不可或缺的基础设施要素 。当然,高能耗的GPU是不是增加算力的最佳乃至唯一选择,我会在另外一期节目中用生命现象的经济性来解读。

说回来, 与其说DeepSeek是中美竞争的产物,倒不如说是中美合作的典范 ,DeepSeek开始的GPU用的是英伟达的,当然目前已经开始试用华为的产品;DeepSeek的核心架构是Transformer,这是八位谷歌员工发明的;DeepSeek的核心算法是AI蒸馏法(Model Distillation),也是由辛顿等人在2015年发明的。

DeepSeek的执行团队是中国的年轻一代,甚至没有海外背景 。所以,借用韩愈师说中的一句,“是故弟子不必不如师,师不必贤于弟子,闻道有先后,术业有专攻。”教学相长,岂不美哉?

这再一次证明了,中美合作就是人类最大的成功保障。DeepSeek此刻还谈不上颠覆,在预算有限的前提下,他们摆脱了算力依赖,在算法层面给全世界提供了一种更聪明的思考方式,这会大大加快全球AI演进的进程。也让中美之间的AI竞争态势有了全新的格局,且一定会加速两国间互相学习、交融和促进,更是给全球原来没有机会发展AI的国家提供了切实可行的新选择。

我们一起点赞这群了不起的中国年轻人!


— END —








请到「今天看啥」查看全文