美国超级膨胀的科技股似乎在几个月前就已经到了需要调整的时候,但触发点却来自一个意想不到的地方。中国人工智能(AI)初创公司杭州深度求索人工智能基础技术研究有限公司(DeepSeek)最新推出的大语言模型可能还算不上“斯普特尼克时刻”,尽管如此,这与早期的太空竞赛仍有相似之处。当时,尽管苏联相对缺乏计算能力和尖端技术,但聪明才智帮助苏联工程师跟上了美国对手的步伐,有时甚至超过他们。DeepSeek的突破颠覆了支撑美国科技公司估值的假设,即美国在人工智能领域的优势不可撼动,只要在芯片和基础设施上花费数十亿美元就能扩大这种优势。
DeepSeek的成就在于开发出一种大语言模型,人工智能专家称其性能与美国竞争对手开放人工智能研究中心(OpenAI)和元宇宙平台公司(Meta)的产品相近,但DeepSeek宣称其使用的英伟达芯片数量更少,也不够先进,而且其训练成本仅为竞争对手的一小部分。这或许意味着DeepSeek可能成为一个强大的科技竞争对手。
▲DeepSeek和聊天生成预训练转换器(ChatGPT)标识(法新社)
首先,DeepSeek是开源的。这与美国的Meta一样,但与OpenAI或谷歌的“双子座”人工智能模型不同。这会吸引开发人员使用和进一步开发。其次,DeepSeek可以用更少的预算和更低的算力组建模型。这就解释了为什么27日股价暴跌的公司不仅有一线科技公司,还有生产芯片设备和为数据中心提供电气硬件的公司。
美国的大公司都专注于一种特殊的人工智能扩展模式,即投入大量资金、数据和算力来解决问题。但先有法国人工智能初创公司米斯特拉尔人工智能公司,现在又有DeepSeek,它们都证明,资源较少的公司最终也可能拥有更智能、更高效的模型。
DeepSeek取得的进展还突出表明,尽管拜登政府出台了出口管制措施,但中国仍设法在人工智能领域实现了技术飞跃。华盛顿没能扼杀中国的创新。通常在国内接受培训的中国工程师在提高效率和寻找变通办法方面取得成功,这让人怀疑Meta、谷歌、OpenAI和Anthropic公司等开支巨大的美国企业设置的技术“护城河”是否像它们想象的那样宽广而不可逾越。
现在悬而未决的问题不一定是谁能开发出最好的人工智能模型,而是谁能把它们最好地应用到现实世界的任务中。中国在应用方面一直做得非常出色。在DeepSeek取得成果之后,这场游戏似乎比原来想象的要势均力敌得多。
本文由英国《金融时报》1月27日发表,原题为《DeepSeek挑战美国人工智能霸权》。