报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。
在第二章《TOP 101-2024 大模型观点》中,中国科学技术信息研究所助理研究员
王政
认为,开源大模型的问题其实不是开源,甚至不是大模型,问题是政府正在深度介入这个技术领域。
自习课上老师坐在前面和班长坐在前面是两种感觉,国家权力机构在场和不在场也是两种感觉。
全文如下:
谈开源大模型的技术主权问题
开源大模型的问题其实不是开源,甚至不是大模型,问题是政府正在深度介入这个技术领域。自习课上老师坐在前面和班长坐在前面是两种感觉,国家权力机构在场和不在场也是两种感觉。这篇文章想讲一讲权力机构的视角,即
“技术主权”
视角。
作为一种科学和技术的门类,开源大模型有(但不仅有)以下两种讨论方式:一种是康德和黑格尔式的,开源大模型受到“世界公民观点下的普遍历史观念”影响,造成共有的财产、公共的财产关系和永久和平的国际关系;另一种是马克思恩格斯式的,认为科技是人的力量的对象化,有时候可能站在人的对立面。
于是,在百年未有之大变局加速演变的时候,那种虚构的“美好时代”(La Belle Époque)就被戳破了,开源大模型实际上被设置在一种冲突的结构中:无论如何界定冲突的主体,其中主要的两方阵营必然不能坐视先进科技加强对方。
所以现在要谈几个问题:
第一,在一个有大模型的世界,冲突的阵营如何界定?第二,在大模型开源的世界,冲突将遵循怎样的客观规律?第三,30 年以后是什么情况?
霍布斯在《利维坦》中说:“一个国家的主权在国境内具有至高无上的权威。”但是显然,在中美两国之外,欧盟国家在大模型上没有什么权威:他们缺少有影响力的企业,唯一一个自主大模型似乎是德国人工智能协会的 LEAM;他们不得不关心立法问题,以响应先进技术对欧洲社会福祉、科技成果转化和国家行为能力的挑战。这就落入了技术主权的窠臼,从社会学的作用方式来说,我们可以从一系列冠以“技术主权”的故事中寻找冲突发生的规律。
例如,2011 年德国时任内政部长 Thomas de Maizière 和时任德国电信首席执行官 René Obermann 发起了 SICT(Security in critical ICT applications and ICT architectures,关键 ICT 应用及基础设施安全)工作组,
在五个不同的应用领域对德国的技术主权进行了审查。
这和 2013 年欧盟宣布将拨款 5000 万欧元,加快 5G 移动技术的发展是先后进行的。
这足以说明欧盟在技术落后的情况下的策略。可以想象:如果欧盟确定自己在大模型方面存在危害国家主权的依赖,他们会通过拨付资金、付诸法律、外交等渠道直接获得优势。而由于客观的国际社会的团块性质,欧盟显然会对中美采取有区别的策略。比如欧盟对华新能源汽车征收高额关税,想要用大模型增强新能源汽车产品力输出欧盟,显然就此存在了人为设置的困难。
早前,开源讨论中有一种强烈的“去主权”倾向,观点最早可追溯到 1996 年美国学者发表的《网络空间独立宣言》。当时普遍认为,互联网是一个全球性和无边界性很强的独立空间,不应将传统的主权概念强加于网络空间上,应该靠技术、标准以及服务协议等自律形式代替主权监管的他律形式。
短暂(20 年)的历史经验标明,Facebook、Google、Twitter,“去主权”论调实际上就是技术先进国家对落后国家的主权的明晃晃重塑。
开源大模型正在发展。黑格尔在某个地方说过,一切伟大的世界历史事变和人物,可以说都出现两次。他忘记补充一点:第一次是作为悲剧出现,第二次是作为喜剧出现。
马克思对黑格尔的扬弃在于发现“喜剧”蕴含的在历史的周期性中的变革性因素,开源大模型不可能也不打算“去主权”:大模型不仅仅要通过显卡和机房去训练,它还要占领各种高标准基础设施去做服务,而建设这些基础设施就是政府行为能力的延伸。那些更加智能、更加聪明的大模型就是这样使用开源这个烟幕弹的。
也就是说,在技术主权划分的阵营对立和一帮墙头草的冲突格局下,开源大模型的历史规律就是阵营内的主权按照技术领先国家的意愿重塑,在阵营之间存在对抗关系。
甚至不需要大模型动手,Linux 这样的互联网基础设施级别软件已经在进行这种对抗(Linux 移除俄罗斯开发者),而俄罗斯也已经宣布重组自己的阵营。
我们现在开始构思开源大模型的技术主权图景:它已经诞生了;它通过每个人的电脑、手机、机房,执行技术先进国家对别国的主权的重塑;它给自己所处的竞争性的国际环境和对抗结构增加了新的变数。
这个变数就是,阵营之间的科技交流管控和阵营内国际科技交流是同步强化的
,北约和华约,马歇尔计划和莫洛托夫计划:它们一开始纯是出于增强己方实力维持对抗强度的要求,后来也伴随国家差别观念的消退和市民社会财产观念的滋长。
于是我们似乎可以判断,如果在这一波即将到来的对抗的高潮之后大模型还存在的话,康德和黑格尔关于国际关系的构想似乎就要在 30 年的实践里逐渐成型。“世界公民观点下的普遍历史观念”让
开源大模型重新具有过去被认为的 “合则两利” 的性质,并形成新的共有的财产和公共的财产关系。
于是现在要问,这 30 年我们这代人怎么办?作者认为有以下几个因素决定了我们的策略:
第一,要做大模型就要做成技术主权划定的本阵营内领先,要能够占据一切基础设施;
第二,不做大模型就要把大模型熬死,让它成为过时的观念,不过问题是你未必上位;
第三,列宁指出科技具有二重力量,即它是资本主义灭亡的力量和社会主义发展的力量,毕其功于一役。
在开源大模型问题上不能用一个纯粹的科技的观点来描述发展现状和未来,而应当用一个综合的社会观点去描述:认识的来源和影响实践的机制。
从这个意义上来说,过去的国际科技交流是一个经济、文化和科技多机制协同的工作方法,它们连缀成了产业链、供应链、价值链、科技依赖链条,产生了复杂的社会实践。但是现在链条上的自由主义放任正在消退,在主要国家关于世界秩序设想的矛盾基础上,各个国家按照自身力量和利益的假设正在尽速地把这张网撕成小块,并且希望抢到其他部分。
这就限制了开源大模型所附着的复杂的社会实践。在一个琐碎、细分、以邻为壑的可能的局面中,知识产权的堑壕两面因为竞争紧紧依靠,似乎“坚定守住就有办法”。
而第一次世界大战已经表明,将防线对面描述为牛鬼蛇神的结果是“旧的国家及其世代相因的治国才略一齐崩溃,以致王冠成打地滚在街上而无人拾取”。
第二次世界大战则表明,一个更高的政治观点引领下的进攻是维持防线的全部手段。“回形针”行动(英语:Operation Paperclip)、“奥萨瓦根”行动(俄语:Операция «Осоавиахим»,德语:Aktion Ossawakim)、中程弹道导弹条约、巴黎统筹委员会 —— 那种加固防线和穿越防线的社会机制从来没有被消灭过。
当这个机制还正在进行的时候,开源大模型的未来就必然受到它的拉扯。决策要同时具有判断力和执行力,要团结就倾其所有的团结,要对抗就看准了方向全压上去。“见小利而忘义,临大事而惜身”,单纯经济观点和单纯科技观点,那只能证明开源大模型的有用性是一个伪命题。
知乎上有一个故事:中世纪欧洲签订契约有一种奇妙的方法,因为大家普遍不识字,所以就到路边随机抓一个小男孩过来暴打一顿;二十年后问小男孩那天发生了什么,记忆犹新。
我是那个小男孩,如果你们不同意我的观点,现在可以开始打我了。