本文主要讨论了OpenAI的模型蒸馏技术引发的法律争议和可能涉及的法律问题。包括模型蒸馏是否构成法律意义下的文本或数据挖掘,是否违反用户协议,以及商业秘密法是否提供合同外的法律保护等。
商业秘密法可能提供合同外的法律保护,但模型蒸馏可能被视为一种反向工程,涉及到非法手段的指责。
文/李汶龙
OpenAI在DeepSeek爆火之后指控其“只是蒸馏”引发了很强的民族热情。实际上,模型蒸馏争议并不新,早几个月OpenAI禁用字节账号训练AI也基本上是相同原理。
可以想象,如果局面倒置,OpenAI的o1 mini蒸馏R1模型,指控美国公司侵权的指责也会层出不穷。OpenAI/Deepseek还涉及到不同国家的法律。如果OpenAI选择追究——实际上Altman目前表示不走法律途径——应该也不会傻到跑到中国来起诉。讨论这个问题还需回到美国法语境。或许中短期内,模型蒸馏不会进入司法纠纷当中,但这个技术现象值得在法律视角下审视一番,至少确定其机理。
回归理性讨论,知识蒸馏是一个有趣的现象,很多人尝试通过技术视角或者类比加以理解,但很少有人在法律视角进行重构和分析。
著作权对于AI训练而言最为重要,但是模型蒸馏的问题上贡献很小。在AI生成内容是否可版权——即受到版权法保护——的问题上,美国版权局的几个决定可见一斑。门槛设定还是相当高,目前甚至还未听到成功案例,相当于关上了半扇门。即便可以证成某些内容受版权保护,版权问题接踵而至。其他AI厂商作为OpenAI的用户,或者使用其账户,生成的内容,谁有权主张版权?目前尚且没有任何真实的纠纷,理论上OpenAI作为AI厂商仅提供技术能力的立场很难在版权争夺上占据有利地位,这也就是为什么Sam Altman当下选择以技术而非法律进行对抗。版权法在模型蒸馏问题上基本处于休眠状态。
模型蒸馏是否构成法律意义下的文本或数据挖掘?这个问题将蒸馏引向版权法的合法例外,对于DeepSeek而言更为有利。关于文本/数据挖掘,欧盟数字市场指令的构造更为清晰,但美国的合理使用理论更为宏观且富有灵活性。在美国,讨论AI语境下的合理使用的案子莫过于前几天刚发布的汤臣路透诉ROSS智能。法官Bibas一改2023年的观点,认为模型训练本身不构成合理使用,但该案不涉及生成式人工智能,因此结论未必能延展到模型蒸馏的讨论。况且,如果可版权性和版权侵权尚且无法构成,也就没有余地讨论合理使用。
有人会说,模型蒸馏违反了OpenAI的用户协议,因此是合同侵权。这么说没错,而且合同或许是目前来看最为明确和扎实的法律基础。但是仅就合同侵权起诉,即便不考虑跨法域执行的难度,本身作为一项法律主张也不够强。再考虑到执行,可能没有企业愿意去踏进这样的纠纷。
关键的问题在于,除了用户协议违规之外,模型厂商是否能够得到更强的法律保护?
版权的延展性不足刚已述及,商标和专利的相关性就更低了。商标是用来区分商品/服务来源的标识,目标是防止市场上的混淆,并不涉及对算法或模型的保护。专利虽然用于保护创新,但强调的是技术方案的独特性和创新性;模型蒸馏更多的是优化模型的技术手段,重点在于提效和减少消耗,而不是新的技术发明,因此很难申请专利保护。
不正当竞争法看起来也相关,目前来看大部分情形下竞争法逻辑都会倾向于支持弱势和新兴一方。因此,反不正当竞争法可能会被挑战者用来突破用户协议的使用限制,而不会反过来支持大企业。换句话说,知识蒸馏的法律挑战应该主要存在于保护商业利益的知识产权领域,而不是竞争或者其他。
此外还有一个关键领域未提,可能会打破局面提供超越合同之外的法律保护:商业秘密。
有人会问,AI产出的内容怎么可能算秘密?
商业秘密的核心并不是指某项技术或工具本身,而是其独特的实现方式、使用方法、优化过程和背后的积累知识。因此,AI生成内容的“秘密性”并不体现在AI工具的普遍可得性上,而在运用这些工具、如何设计模型以及如何优化这些模型来满足特定的商业需求。
美国法语境中,构成商业秘密的要件有以下几个方面
• 信息的独特性或秘密性——当然,在模型蒸馏的语境中,这里的信息并不是指模型产出的内容,而是企业通过研究和开发积累的算法、数据和工艺等,例如在算法数据、数据选择和处理方式上的细节。如果这些技术细节是企业内部独有未公开披露,那么就符合商业秘密的“秘密性要求”。
• 商业价值——商业秘密必须对持有者具有实际经济价值,尤其是在它未被公开时,这种价值来源于其秘密性和稀缺性。如果信息公开,其他公司可以轻易复制或利用,商业价值大打折扣,商业秘密法的保护也就受限。模型蒸馏能够提高计算效率、节约资源和降低部署成本,因此带来显著经济利益。
• 采取合理保护措施保护该信息不被泄露或者非法获取,包括保密协议、限制访问权限、数据加密、物理或者数字手段隔离等。
• 商业信息的滥用或者盗用,即非法获取、使用或披露。
至少在理论上,OpenAI可以主张“知识蒸馏” 馏出了一些具有商业价值、可以直接用来市场竞争并被竞争者滥用的“秘密”。
然而,商业秘密法存在一个软肋,即反向工程,而知识蒸馏可能成为一种反向工程的形式从而削弱商业秘密法的保护。反向工程即通过分析和研究已经获得的产品、技术和信息、逆向推导出其背后的设计、算法和工作原理,这一过程并不必然涉及非法获取或侵犯秘密。美国法中,反向工程本身并不被视为是违法行为。尤其是以研究,或者以实现上下游产品兼容和技术互操作性上,反向工程的合法性曾得到证成,即便被研究的产品或技术背后包含商业秘密。