专栏名称: 观察者网

观察者网，智库与专业新闻媒体的完美结合。

外媒坐不住了："中国大模型实现反超！"

观察者网 · 公众号 · 社会 · 2025-02-01 17:08

正文

►文观察者网张广凯

“中国可能已在人工智能竞赛中超越美国。”面对DeepSeek -R1模型的优异表现，美联社近日发出这样的感慨。

《华尔街日报》则以《DeepSeek 搅乱中美科技战》（DeepSeek Scrambles U.S.-China Tech War）为题，报道了DeepSeek在美国科技界和政界引发的混乱：有人试图进一步推进脱钩政策；有人却不禁反思，“小院高墙”政策已经无法阻挡中国科技崛起。

随着DeepSeek热度持续发酵，越来越多的美国媒体也注意到，DeepSeek绝不是唯一一个正在追上OpenAI的中国大模型公司，包括百度、阿里、字节在内的中国军团，有望让中国在 2030 年成为该领域的世界领先者，逐渐超越美国。

回顾从2023到2025 的三个春节，科技行业最大新闻的变迁，正在重塑世界格局。

面对DeepSeek，美国人乱了阵脚

近年来，中国任何一点科技突破都难免被美国拿来炒作恐慌，DeepSeek自然也逃不过。

尽管美国精英曾说DeepSeek的进展是“好事”，但更多人却试图把DeepSeek说成是对OpenAI的抄袭。白宫人工智能顾问大卫·萨克斯（David Sacks）宣称，DeepSeek“有可能”窃取了美国的知识产权才得以崛起。

相比于政客，美国科技精英过往更多以自由开放的形象示人，这次也坐不住了。

OpenAI亲自下场发难，表示DeepSeek利用他们的模型进行训练，涉嫌侵犯知识产权。

此前DeepSeek-V3 的技术报告中曾经提到，该模型使用数据蒸馏技术生成的高质量数据提升了训练效率，但并未说明具体蒸馏了哪个模型。而OpenAI也并未给出自家模型被蒸馏的证据。

在业内人士看来，模型蒸馏已经是行业内常见做法，是技术普惠的重要途径，其合法性并无统一标准。

另一家美国大模型企业Scale AI 的负责人亚历山大·王 (Alexandr Wang)呼吁美国收紧出口限制，以让该国公司保持技术领先地位。

但自相矛盾的是，美国科技界一边努力打压DeepSeek，一边却还要贬低DeepSeek的成绩。OpenAI的竞争对手Anthropic创始人Amodei发文称，DeepSeek“也就是我们7-10个月前的水准”。

OpenAI创始人奥特曼（Sam Altman）也表示，DeepSeek确实做了一些非常好的事情，但总的来说，这被严重夸大了。

对此，众多美国网友都注意到其中的讽刺意为。一名网友指出： “当你在恳请政府介入阻止其他人发展AI，你就已经承认了自己被打败。”

美国硬件服务商的反应则更加诚实。截至1月31日，英伟达面向开发者服务的NVIDIA NIM平台已经上线了DeepSeek-R1模型。英伟达介绍称，DeepSeek-R1模型是最先进、高效的大型语言模型，在推理、数学和编码方面表现出色。

亚马逊方面同日也宣布，DeepSeek-R1模型现已正式入驻亚马逊的人工智能模型市场Bedrock及机器学习平台SageMaker Al，供用户广泛使用。

此前，微软已经把DeepSeek-R1抢先部署在了自家的云服务Azure上。

这显示出美国企业界的混乱态度——既担心被中国企业占据主导地位，又不愿错过来自中国的巨大商机。

中美大模型的真正差异在这里？

在DeepSeek连续多日被美国舆论审视之后，越来越多的美国媒体也开始意识到，中国优秀的大模型企业不止是DeepSeek。

《华尔街日报》专门发文指出， “不仅仅是DeepSeek，这些中国大模型公司你也需要知道”。文章提及百度、阿里等企业，指出百度文心一言已经有4.3亿用户。

美联社也盘点了多家“中国领先的人工智能模型”，列举出阿里云通义千问、百度文心一言、字节的豆包和月之暗面的Kimi。

尽管OpenAI和Anthropic两大巨头都不承认中国大模型的能力已经抹平差距，为何普通美国人却对中国产品趋之若鹜？苹果人工智能Apple Intelligence近期的遭遇或许能说明一些问题。

去年发布的iPhone 16系列搭载的AI技术，表现可谓令人失望，其AI总结新闻的功能更是频频犯下低级错误。

例如去年12月，苹果智能在推送一名枪手当街射杀美国联合健康保险公司首席执行官的新闻时，将其错误提取总结成枪手对自己开枪，并以“BBC新闻客户端”的形式展现，引起BBC官方吐槽。

苹果刚刚发布的2024年第四季度财报显示，iPhone业务当季营收同比下降了0.9%，显示出AI 功能在市场上遇冷。

反观中国大模型产品，在获取及时、准确的信息方面普遍展示出更优秀的能力。

以百度文心一言和OpenAI的ChatGPT做对比。

1月29日，一架美国客机与美军直升机在华盛顿机场上空相撞引发严重空难。当要求两个模型给出客机载客人数，以及遇难者中包含的运动员数量时，尽管双方都回答正确，但是可以看到，ChatGPT仅仅简单回答了问题，文心一言在数字之外还给出了更加详细的事故信息。

而如果把提问领域从美国新闻转移到中国新闻，双方就体现出更加明显的区别。

例如，对于提问“2025年中国的法定假日有哪些”，文心一言不仅给出正确答案，还专门提到国庆中秋是连休；ChatGPT则给出了明显错误的回答。

对于春节档电影《哪吒2》中，“藕粉制作过程中出现了哪些让哪吒感觉不适的操作”，ChatGPT也完全没能获取到剧情细节。

文心一言与ChatGPT的差异来源，在于百度更加重视检索增强生成（RAG）技术，并在行业内较早地针对文生图场景开发了iRAG技术。

时至今日，大模型虽然能够解决复杂的数学、编程等问题，具备了很多领域的专业知识，但是时而也会出现“幻觉”，给出一些明显错误、令人啼笑皆非的回答。这样的模型能力再强，也无法被广泛应用于实际的生产生活之中。

借助RAG技术，AI能够基于人类提供的素材作为参考来生成结果，而非完全凭空想象。例如，要求大模型生成一张天坛图片，大模型往往会给出四层结构、似是而非的“天坛”，而天坛实际上只有三层。通过引入iRAG技术，大模型以真实的天坛图片为参考，就能够避免类似幻觉的发生。

对