深度求索的新模型发布动摇了人们对谁在技术开发中占据上风的假设。
周一,全世界都在目睹1万亿美元在一天之内从股市中蒸发,这场巨大的篝火是由鲜为人知的中国人工智能初创公司深度求索(DeepSeek)点燃的。
其新AI模型R1的发布颠覆了关于美国在AI领域霸主地位的假设,并提出了一种可能性,即中国的一些人正在学习如何在硅谷擅长的领域击败它。
该模型能够“推理”解决复杂的科学问题,其性能与美国科技巨头的尖端软件相当,但显然其开发成本仅为这些模型的一小部分。
它迅速取代了OpenAI的ChatGPT,成为美国iOS应用商店中下载量最高的免费应用。
除了地缘政治挑战,深度求索的突破对科技行业也有双重影响。首先,它可能会加速人工智能的商业开发和普及,就像ChatGPT在2022年所做的那样。
同时,它似乎表明开发先进的人工智能模型不需要大量的基础设施和资本,这可能会推翻支撑整个美国股市的投资假设。
从加州到华尔街,人们突然急切地提出这样一个问题:中国是否在人工智能领域已经赶上了?许多业内人士声称,他们正处于一个历史性突破的边缘,这一突破将使机器达到与人类智力相当的水平——即所谓的通用人工智能门槛。
“深度求索的算法创新提醒我们,中国和美国并驾齐驱,我们的技术优势并非稳操胜券,这促使我们的行业提高人工智能的效率,”谷歌(Google)前首席执行官兼董事长埃里克•施密特(Eric Schmidt)说。
“要率先实现通用人工智能(AGI),我们需要继续投资于人才,支持我们充满活力的开源生态系统,并确保我们在创新上超越竞争对手,而不仅仅是在支出上。”
深度求索是在硅谷风格的雄心壮志下成立的。2023年,当复制ChatGPT的竞赛正在升温时,它最初是对冲基金亿万富翁梁文锋(Liang Wenfeng)的一个副业项目。此后,它已成为中国领先的人工智能实验室之一。
“为什么硅谷如此具有创新性?因为他们敢于尝试,”梁文锋在去年的一次采访中说。“当ChatGPT问世时,中国的科技界在前沿创新方面缺乏信心。”
他补充道:“从投资者到中国大型科技公司,他们都认为差距太大,因此选择专注于应用。但创新始于信心。”
近年来,中国的国有资金在为初创企业提供资金方面发挥了更大的作用,创业生态系统感到压力,担心如果不能保证回报就会损失国家资产。
深度求索在中国生成式人工智能初创公司中独树一帜,因为它没有进行任何外部融资,因此不受这些限制的约束。
深度求索是一个纯粹的研究实验室,类似于英国的DeepMind和美国的OpenAI的早期阶段,专注于推动人工智能领域的发展,而不是试图盈利。尽管它以完全依靠本土人才为傲,但它采用了常见于美国科技中心的文化。
“在中国的人工智能公司中,它是独一无二的,”一位中国的人工智能投资者说。“这里没有像其他大型科技公司或更大初创企业那样的政治或管理摩擦。员工没有特定的头衔或汇报关系。”
深度求索起源于一家量化对冲基金,这意味着它拥有对芯片有深入理解的工程人才。其突破在于它似乎成功地训练了先进的人工智能模型,而没有像美国竞争对手那样花费数亿美元。
据称,R1的最终训练步骤仅花费了560万美元。然而,这一数字并未包括开发其模型所涉及的许多其他成本,如计算基础设施和之前的训练运行,这使得很难进行精确的比较。
它可能也为了节省成本而走捷径:OpenAI声称有证据表明,深度求索在训练中使用了OpenAI模型的输出——这违反了其使用条款,尽管这种不正当做法被认为在美国公司中也很普遍。
具有讽刺意味的是,华盛顿自2022年起对高端美国芯片实施出口管制,试图阻碍中国的人工智能行业,反而可能促成了深度求索的突破。
由于无法获得尖端的硅材料,该公司被迫寻找创新方法,从能够购买的较低端芯片中挤出更高的性能。
该公司关于其模型低成本和先进功能的宣称引发了一场关于其颠覆性影响的激烈辩论。硅谷的领军人物对其创新表示赞赏,同时也淡化了其重要性。
OpenAI首席执行官萨姆•奥尔特曼(Sam Altman)称R1模型“令人印象深刻”,而Meta首席执行官马克•扎克伯格(Mark Zuckerberg)则称赞该公司取得了“我们希望在系统中实现的进步”。
然而,扎克伯格还表示,深度求索的突破只是这个以惊人速度发展的领域中的众多突破之一,因此很难说其低成本方法将如何深刻地改变行业动态。
根据一些中国科技观察者的说法,深度求索的进展不足以改变这样一个事实:中国的人工智能公司一直是快速跟随者,主要致力于模仿美国同行,而不是自己引领方向。
“深度求索的工作属于这一类。如果他们能建造出真正推动前沿的东西,那将真正改变美中竞争的局面。我们拭目以待他们是否能做到这一点,”乔治城大学安全与新兴科技中心的人工智能政策分析师、OpenAI前董事会成员海伦•托纳(Helen Toner)说。
然而,另一些人认为,一家中国科技初创公司在最新引人注目的进展中扮演了幕后推手的角色,这标志着一个分水岭时刻,改变了两国在人工智能竞赛中的动态。
“深度求索的最新模型可能并不意味着中国在人工智能竞赛中领先于美国,但它确实证明了中国公司在软件创新方面取得了显著进展,从而减轻了美国出口管制的限制,”专注于中国的研究公司Gavekal Dragonomics的中国科技分析师Tilly Zhang在本周发布的一份报告中写道。
“争夺人工智能领导地位的竞赛不再只是谁能获得最好的芯片,而是谁能最好地利用它们。”
尽管深度求索的技术突破的重要性仍有争议,但毫无疑问,当投资者消化其主要创新——大幅降低最先进AI模型训练成本的影响时,股市经历了一场震动。
深度求索的模型似乎削弱了美国人工智能公司在过去一年中大力宣称的论点:人工智能的进步需要大量的资本和基础设施来大规模开发和部署其技术。
相反,他们认为,美国开发的更昂贵的模型几乎没有什么区别,这引发了投资者对急剧通缩冲击的担忧。
“曾经有一种美国例外主义的感觉——只有美国拥有这项技术,只有美国人有资金来做这件事,”联博(AllianceBernstein)的美国成长型股票投资者吉姆•蒂尔尼(Jim Tierney)说。“这些模型的商品化进程比我们预想的要快得多。”
硅谷的许多人依赖于这样的论点:行业中的其他公司会迅速复制深度求索的创新,从而降低整个行业中训练AI模型的成本。像微软(Microsoft)的萨蒂亚•纳德拉(Satya Nadella)这样的高管声称,这将使技术对客户更为实惠,并促进其使用——这将惠及整个行业。
为了展示公司对自身地位的信心,深度求索发布了其研究成果,并以“开放权重”的形式发布了其模型。这是一种更有限的开源软件版本,允许任何人下载、使用和修改该技术。
此举将吸引众多国际软件开发者的关注,他们正在寻找“开放”模型来构建应用程序。尽管硅谷领先的人工智能公司开发的大多数模型仍然是封闭的,但也有例外——尤其是Meta,其开源模型的受欢迎程度迅速上升。
但深度求索的模型成本更低。这家中国公司表示,每生成100万个token仅收取1.4美分,大约相当于70万个单词。相比之下,Meta对其最大模型的相同输出收取2.8美元。
“许多开发者正在试验目前的中国开源AI解决方案,”牛津互联网研究所(Oxford Internet Institute)专注于AI地缘政治的研究员基根•麦克布莱德(Keegan McBride)说。“这确实表明,在AI领域,美国并不是唯一的选择。”
尽管Meta的首席AI科学家杨立昆(Yann LeCun)对深度求索给予了高度评价,称其证明了“开源模型正在超越专有模型”,但这家初创公司仍然对Meta构成了直接挑战。
托纳表示:“该公司以创建不太落后于前沿技术的开放权重模型而闻名,而深度求索刚刚在他们擅长的领域击败了他们。”
除了Deepseek对人工智能产品市场的影响外,其突破也有望在地缘政治上产生影响,因为许多人认为这正是美国和中国争夺人工智能霸主地位的关键时刻。
Meta的扎克伯格警告说,如果R1及其后续版本成为“开放”AI模型的全球标准,将会对美国不利。他说:“为了我们的国家优势,重要的是它成为一个美国标准。我们希望构建一个全世界都在使用的AI系统。”
微软资深人士、前白宫顾问克雷格•蒙迪(Craig Mundie)表示,深度求索“加速了每个国家的人们评估……各国之间新兴技术力量平衡的紧迫性”。他为OpenAI的萨姆•奥尔特曼提供技术政策和战略建议。
美国人工智能初创公司Anthropic的首席执行官达里奥•阿莫迪(Dario Amodei)警告称,如果中国在人工智能领域已经与美国平起平坐,这将对该技术最终可能应用于的所有领域产生影响。
阿莫迪在谈到深度求索的进展时写道:“中国似乎可能将更多的人才、资本和精力投入到该技术的军事应用中。结合其庞大的工业基础和军事战略优势,这可能帮助中国在全球舞台上取得主导地位,不仅在人工智能领域,而是在所有领域。”
蒙迪是已故美国国务卿亨利•基辛格(Henry Kissinger)创立的美中人工智能对话(US-China AI Dialogue)外交论坛的主席,他指出,人工智能是“终极双用途技术”,这意味着它既有积极的用途,也有危险的用途。
在未来90天内,当外交小组召开会议讨论人工智能软件的多边但通用的安全结构时,深度求索的出现可能会成为讨论的焦点。蒙迪在他与基辛格和施密特合著的最新书《创世纪》中对此进行了探讨。
“这并不意味着每个人都会有相同的法律或规则,但构建一个架构,让这些机器在成长过程中理解人类价值观并符合全球社会选择,我认为是一项紧迫的任务,”蒙迪说。
与此同时,中国有抱负的年轻企业家正将深度求索及其创始人视为灵感来源,致力于打造新一代强大的技术。
本周,一位前来广东湛江米历岭(Mililing)村梁文锋家中致敬的青少年表示:“他是一位务实的技术专家。他组建了一个团队……超越了我们以前无法与之竞争的OpenAI等公司。他是一位为中国做出贡献的伟人。”