随着DeepSeek这两天火遍全网,美国的舆论风向也在变化,从一开始的懵逼、惊叹、赞赏,到有些酸葡萄和充满敌意的声音冒了出来。
人工智能数据平台Scale AI的首席执行官Alexandr Wang一口咬定DeepSeek有5万块走私的H100,但因为违反了美国出口管制所以不敢对外说。他这么说不奇怪,Scale AI一直努力融入美国“国防科技”的圈子,前高管Michael Kratsios现在当了特朗普的白宫科技政策办公室主任,
Alexandr更有责任秀一把爱国了
。他没有提出任何证据,英伟达今天也出来澄清没有这回事,但这的确好像一下子解释了为什么DeepSeek突然这么牛,有不少美国人真信了。
这几天,美国国会和白宫还处在政府换届的忙碌和混乱中,没有对DeepSeek这事做什么回应,但几乎能确定的是,如此高的讨论热度必然已让DeepSeek进入特朗普政府的视野。这家专注于模型研发、对外低调的公司,已经被动卷入了中美人工智能的地缘政治,今后任何决策和动作都无法再忽视这个因素。对一家只有100多人的公司和创始人梁文锋来说,这是一个挑战。
同时,DeepSeek的崛起,影响的只是美国的开源模型生态或英伟达的股价。对正在审查拜登任内人工智能政策、刚推出了5000亿美元AI基建计划的特朗普政府,这也是个重大冲击,可能直接影响其未来的政策走向。
虽然我们还不知道美国新政府怎么看这个事,但他们一定感受到了中美人工智能竞争的激烈,也认识到在人工智能方面中国是美国多么强大的一个对手。正如《经济学人》的文章标题所言,“中国人工智能紧赶直追,给特朗普出了道难题”。他未来是重发展美国还是限制中国将是看点。
在此情况下,美国国内对DeepSeek冒出很多敌意,不足为奇。在我看来,OpenAI的早期投资人,Thrive Capital的创始合伙人Joshua Kushner今天在X上的一番言论颇有代表性,也比较全面展示了这种敌意:
“‘亲美’的技术专家们竟公然支持一款基于美国前沿领先
模型训练
出来的中国模型,而训练所用芯片很可能违反了出口管制规定,并且根据该模型自身的服务条款,还会将美国客户数据带回中国。”
违反芯片出口管制、偷了美国模型、把美国人数据交给中国,三条罪状刀刀见血,值得引起重视。毕竟,这些声音可能代表了美国国内相当一批“科技民族主义者”的看法,也直接刺激美国国会和政府的神经。
对有没有违反美国芯片出口管制,估计是要调查的,但DeepSeek的出现会对特朗普政府关于芯片出口管制政策的评估产生什么影响,是更大的事。
DeepSeek的成功之一,是探索出了一条新路,在芯片(算力)受限情况下,以最低成本做出比肩美国的前沿模型。这一定程度上冲击了此前纯粹靠堆算力提升模型性能的路径,也是导致今天英伟达股价大跌17%的内在逻辑。人们很自然地会思考:这是否意味着以后不需要太多高端GPU了,那美国对中国的高端芯片出口管制还有什么用?
在此问题上,美国国内过去几天经历了激烈的争论。一些分析人士认为,DeepSeek横空出世,代表了拜登政府芯片出口管制政策的失败甚至反作用:你看你对中国禁运芯片,反倒逼他们想出来怎么用最少芯片训练出很强的模型。但也有些专业人士认为,芯片出口管制本就有滞后性,效果显现需要时间,拜登政府最后几天甩出的“AI扩散出口管制框架”是个大招,应能补上之前的漏洞;而且连DeepSeek的老板梁文锋自己都承认,他们现在最大的制约因素仍然是高端芯片禁运,怎么能说出口管制没用呢?还有些人认为,DeepSeek训练这些模型也是用的美国的H800 GPU,美国为当初就不该放开这类芯片,养虎为患。
这些不同的观点,都会反映到美国政府那里,未来政策取决于哪些观点被决策者入耳入心。几乎可以想象,英伟达等美国芯片企业、半导体制造设备商肯定要拿这个为例子,向特朗普政府论证应当取消芯片出口管制。
但支持出口管制的阵营也很强。英伟达这次的回应,也强调了DeepSeek“推理时动态扩展”技术路线仍需要大量GPU。目前H20等不受控的GPU执行推理任务表现出色甚至优于H100,如果DeepSeek事件促使美国政府不仅卡中国模型训练,也想要限制推理,对中国禁运H20也不无可能。拜登政府末期,智谱成为首家上了实体清单的中国大模型企业。考虑到特朗普第一任期对实体清单等各类制裁清单的痴迷,如果未来美国政府把更多中国大模型企业放进实体清单,似乎也不是多么出人意料。
所谓“基于美国前沿领先模型训练中国模型”,可能引发对美国开源模型监管的反思,这是个更复杂的问题。美国科技界具有深厚的开源文化,主流观点认为美国技术领导力受益于开源。拜登政府考虑过对开源模型进行出口管制,但最终放弃了,既是因为缺乏法律依据,也是因为美国司法判例曾多次认定代码是一种思想和创意的表达方式,是受宪法第一修正案保护的“言论”。如果强行管制,不仅于法无据,反而可能违宪。因此,对开源软件,除了一些具有军事和安全意义的加密软件,美国出口管制法是不管的。
尽管DeepSeek和Llama使用的模型架构不同,也未直接基于任何特定的美国开源模型进行开发,但美国还是有一些人认为
DeepSeek
是在
Llam
a
基础上发展起来的,从而一定程度引发了一些争论:Meta当初是不是就不该搞什么开源,这下不仅让中国人学了去,而且青出于蓝胜过了师傅。从开源社区的视角,这种观点是有些荒谬的,但从政策制定者角度,却可能不无道理。美国政府或许会思考:美国是否应该吸取教训,限制一下中国对开源模型的参与。
目前全球开源模型开发者托管模型代码和权重的主流开源平台包括Hugging Face、Github等,都受美国法律管辖。GitHub上的开源模型代码在遵守自身开源许可证的同时,也可能作为GitHub上的信息(Information)受到出口管制等美国法律的监管,影响开发者相关的上传和下载行为。
我倾向于认为美国不会极端到限制中国开源模型开发者访问或使用开源平台,因为这对美国开源社区的副作用会很大,只会把中国开发者赶到OpenI启智社区等中国开源平台,丰富中国本土开源生态。
但美国历史上真实发生过管制开源平台的例子。2019年7月,为了遵守美国政府对伊朗的制裁,GitHub曾限制伊朗用户访问其平台的私有代码库和部分公开代码库,甚至直接屏蔽了部分伊朗开发者的账户,导致很多开发者的项目被迫中断。尽管此事引发了国际开源社区对Github的广泛质疑,迫使其最终通过向财政部申请出口许可部分解决了问题,但殷鉴不远,值得中国的开源模型开发者警惕。
Joshua Kushner最后提到的“将美国客户数据带回中国”,本质是中美数据跨境流动这个老问题,再往上一层则是目前中国大模型应用在美国应用商店上架、可供美国用户下载和使用的问题。特朗普第一任期,曾试图以《国际紧急经济权力法》(IEEPA)为依据,迫使美国应用商店下架中国应用程序,最终因受制于“伯曼修正案”在法律诉讼中败北,并因随后的败选而不了了之。本届任期,特朗普是否会延续此前针对中国应用程序的政策,目前尚不明朗。