专栏名称: ACG法实务
垦丁律师事务所威理扬法律团队,骨灰级二次元迷汇集地,专注ACG(Animation、Comic、Game)国内合规、出海日本、欧美等国合规方案。Ps:“威理扬”,来源于田中芳树的《银河英雄传》的主人公“杨威利”。他不闪耀,但不可缺少。
目录
相关文章推荐
闹闹每日星运  ·  星历0308:巨蟹参加聚会 水瓶理解别人 ·  2 天前  
闹闹每日星运  ·  睡眠很差?试试12星座都适用的5+3心理大法 ·  2 天前  
闹闹每日星运  ·  星历0307:射手合理安排时间 ... ·  3 天前  
闹闹每日星运  ·  有800个心眼子,但超会做人的星座 ·  4 天前  
闹闹每日星运  ·  只要找到喜欢的事,立马能咸鱼“翻身”的星座 ·  4 天前  
51好读  ›  专栏  ›  ACG法实务

原创|投喂数据给人工智能,构成合理使用吗?基于美国汤森路透诉ROSS侵害著作权纠纷的思考

ACG法实务  · 公众号  ·  · 2025-03-04 16:58

正文

作者 丨 林    娜

编辑 丨 小    威

主编 丨 林    娜

著作权的权利范围和权利限制,是一对精妙的平衡器。合理使用作为权利限制的一种形式,在不同的法系下,存在不同的立法结构和解释。著作权与技术从来是双生子。随着人工智能技术的蓬勃,对于将他人作品“投喂”、“训练”人工智能,是否构成侵权?还是如同 web1.0 时代计算机的临时复制一般,构成合理使用?成了一个难解之谜。


最近,美国著名的法律数据库服务提供商汤森路透旗下的 Westlaw ,与其潜在竞争对手 ROSS 之间的一起侵犯著作权纠纷,让我们有契机反思 在人工智能场景下,“投喂”、“训练”等行为,与著作权法上的合理使用是什么关系。

01

汤森路透诉 ROSS 侵害著作权纠纷的事实背景

汤森路透(Thomson Reuters)的主营业务涵盖法律研究平台服务,旗下Westlaw法律数据库为核心产品。用户通过付费方式,能够访问该数据库丰富的内容,其中囊括案例法、州及联邦法规、州及联邦条例、法律期刊以及专著等。


Westlaw平台具备独特的功能体系。其借助Key Number System对司法意见予以分类,并提供“headnotes”,即针对法律要点的简短总结,用以提炼案例的核心要点与关键法律问题,助力法律从业者及读者快速把握主要内容。每一个headnote均与特定的key number相互关联,用户点击headnote可直接链接至意见书中对应的段落,点击key number 则能查看就相同法律要点作出裁决的案例列表。Westlaw主张对其所提供的“原始和修订的文本及法律材料的编纂”享有著作权,包括headnotes以及Key Number System。

但上述的检索方式,着实复杂。看到市场空间的ROSS,试图创建一个“自然语言搜索引擎”,这套引擎使用机器学习和人工智能,以实现用户输入问题,其搜索引擎会直接提供司法意见的引用。为实现该产品的效果,ROSS需要获取Westlaw案情摘要中的数据,来训练其人工智能搜索工具。ROSS尝试获得汤森路透的许可,但被拒绝。

于是,Ross曲线救国,转向第三方法律研究公司Legal Ease Solutions达成合作,Ross指示LegalEase基于Westlaw案情摘要编写、创建包含法律问题和答案的备忘录,问题旨在模拟律师会问的问题,答案则是直接引用法律意见。该项目产生了大约25,000个问题和答案集。Ross用这些数据来训练其人工智能搜索工具。

汤森路透对于Ross的该等行为,显然不会坐视不理。不用多久,汤森路透指控被告通过使用Westlaw数据库内容训练其AI工具,侵犯了其著作权。ROSS的主要抗辩理由为:认为其使用汤森路透数据的行为构成合理使用。

该案由美国特拉华州地区法院审理,并于2023年做出了裁定,法官BIBAS驳回了简易判决动议,认为在版权保护范围和合理使用抗辩等关键问题上存在事实争议,需要由陪审团裁定。

然而, 2025年2月11日,该案法官BIBAS做出部分简易判决,对2023年的裁定进行了修订,支持了汤森路透对于ROSS行为构成直接侵害著作权的部分主张,并明确驳回了被告关于合理使用的抗辩——即认定ROSS对汤森路透数据的使用行为,不构成合理使用。


02

2 023 BIBAS 法官驳回简易判决动议

在进入 ROSS 的行为是否构成合理使用之前, 2023 BIBAS 法官先在逻辑上解决或尝试解决了几个前置问题:


1. 汤森路透是否对其数据库中的单个文件享有著作权?


被告 ROSS 的主张之一,是汤森路透仅对 westlaw 数据库整体作为汇编作品,享有著作权,但对于构成数据库的单份文件是不享有著作权的。

在本案中,法院认为,汤森路透对于数据库的著作权可以覆盖到数据库的单个文件上。具体来说,法院指出,一个编纂作品的著作权延伸到该编纂作品中可受著作权保护的部分。当编纂作品的作者通过其原创文字呈现事实时,其他人可以复制这些事实,但不能复制用于呈现这些事实的确切文字。此外,法院还提到,原告必须拥有注册才能提起联邦侵权诉讼,但可以基于该注册的全部受保护组件提起诉讼。因此,汤森路透可以对其数据库中的单个文件(如头注释)拥有独立的著作权保护,前提是这些文件满足著作权保护的条件。


2. ROSS 投喂给其人工智能的数据,是否与汤森路透享有著作权保护的作品构成实质性相似?


在这个问题上,法院没有给出明确的回答,却给出了一系列细致的分析。包括考察了直接证据、间接证据、专家报告的权重、陪审团的决定等。最终,法院将是否构成实质性相似交由陪审团判断。法院在简易判决中认为:实质性相似的判断需要考虑普通观察者是否将两部作品视为基本相同。由于 ROSS 使用的和汤森路透的头注释可能因为共享不能受到著作权法保护的司法意见而看起来相似,因此需要判断 ROSS 的作品是否与汤森路透的受保护表达实质性相似,而不仅仅是与司法意见相似。


3. ROSS 对作品的使用,是否构成合理使用?


对于该问题,法院在简易审判中,交由陪审团进行。其围绕合理使用的主要说理如下:


依照美国著作权法第 107 条的规定,构成合理使用包括四个要素。


1 )使用的目的和性质: 这是最重要的因素之一。它包括商业性和转化性两个部分。商业性使用通常不利于公平使用,而转化性使用则有利于被认定为合理使用。转化性使用是指新作品传达了与原作不同的新事物或扩展了原作的效用。简易判决表示, Ross 的使用显然是商业性的,但其目标是通过构建一个法律研究平台来与 westlaw 实现竞争。尽管 Ross 的使用是商业性的,但其转化性可能更重要,因为其目标是创建一个能够直接提供法律意见摘录的搜索工具,而不需要用户进行额外的点击或阅读评论。


2 )作品的性质: 这个因素考虑作品是否接近版权保护的核心。对于不同作品的合理使用范围不同,信息性作品相较于创造性作品,其合理使用的范围更大。在本案中, Key Number System headnotes 都不并非著作权保护的核心内容,因为它们更多地是信息性的材料组织方式,而不是传统意义上的文学艺术作品。


3 )使用的数量: 法院认为,复制的数量和是指取决于 ROSS 人工智能输出的性质。这个因素考虑复制的数量以及是否复制了原作的“核心”。依照简易判决,如果以 headnote 为单位作品,那么复制的数量可能很大,但如果以整个编纂为单位,复制的数量则相对较小。如果 Ross 的人工智能是按照其描述工作,那么它可能只复制了司法意见的内容而非 westlaw 的独创性表达,这可能构成合理使用。但具体仍然需要陪审团查明。


4 )对潜在市场或价值的影响: 这个因素考虑使用对原作市场或价值的影响。简易判决中提到 Ross Thomson Reuters 在法律研究平台市场上竞争,但是否 Ross 的产品是 Westlaw 的替代品还不清楚。


据此可见,对于被告使用的对象与原告作品是否构成实质性相似、被告行为是否构成合理使用等关键性问题,简易判决均未做出最终定论,而交由陪审团判断。但至今为止,尚未见陪审团的判断。

03

2025 BIBAS 法官修正其简易判决,驳回了 ROSS 的合理使用抗辩

2025 年, BIBAS 法官修正了其简易判决,就合理使用的部分,法院重申了合理使用的四个因素:使用的目的和性质(包括是否为商业性使用或非营利教育目的)、作品的性质、使用部分的数量、对作品的市场份额的影响。


1. 就使用的目的和性质: 法院认为, Ross 的使用是商业性的,并且不具有转换性,因为其使用目的与汤森路透的头注释目的相同或高度相似,且为商业性质。因此在这一因素上对汤森路透有利。


2. 就作品的性质: 法院指出,虽然头注释和 Key Number System 具有一定的创造性,但它们的创造性程度并不高,因此在这一因素上对 Ross 有利。


3. 就使用数量: 法院认为, Ross 的输出并未包含 Westlaw 的头注,因此在这一因素上也对 Ross 有利。


4. 对潜在市场或价值的影响: 法院认为, Ross 的使用可能会影响汤森路透的原始市场以及潜在的 AI 训练数据市场,因此在这一因素上对汤森路透有利。


在综合考虑所有因素后,法院得出结论,认为第一个和第四个因素,有利于原告汤森路透,而第二和第三个因素有利于被告 Ross 由于第四个因素被认为是最为重要的,法院最终裁定汤森路透在合理使用方面胜诉,即驳回了 Ross 有关其使用属于合理使用的主张。

04

该案对生成式人工智能场景下合理使用的一些启示

1. 人工智能与生成式人工智能的区分


本案备受关注,原因在于被告将作品用于人工智能训练,从表象上看,似乎涉及生成式人工智能场景下,使用他人作品进行 “投喂” 是否构成合理使用这一棘手问题。 但需明确,本案被告 Ross 所采用的技术属于人工智能范畴,并非生成式人工智能,二者在技术原理和输出机制方面存在本质差异。


生成式人工智能主要依托深度学习技术和大语言模型,能够生成与训练数据相似的内容。而 Ross 的产品是一款专门针对法律领域的人工智能研究工具,主要用于法律检索与法律分析,其交互方式采用自然语言。该产品并不具备 “生成” 内容的能力,只是为用户提供了更为便捷的自然语言交互途径,这也是 Ross 产品与 Westlaw 的本质区别所在。


2. 合理使用的分析路径


由于人工智能模型在训练方法、用途、目的以及最终产品呈现形式上各不相同,因此对于是否构成合理使用的判断,需要结合合理使用的四要素,逐案进行具体分析,并非简单的 “非黑即白” 式判定。

在本案中, BIBAS 法官在修订后的判决里指出, Ross 声称其对作品的使用不构成合理使用,这一结论是通过对合理使用四要件分别进行分析得出的。


即便在生成式人工智能场景下,对于 “投喂” 和 “训练” 行为是否构成合理使用,同样需要依据个案实际情况审慎判断。 需综合考量投喂与输出的关系、生成目的、最终生成物的表达方式、投喂内容与原作的差异程度、投喂数量、作品性质以及市场份额等多方面因素,不能一概而论。


3. 汤森路透与Ross的著作权纠纷的参考价值








请到「今天看啥」查看全文