专栏名称: 知产力
为创新聚合知识产权解决方案
目录
相关文章推荐
上海浦东法院  ·  悬赏公告 ·  2 天前  
上海浦东法院  ·  悬赏公告 ·  2 天前  
Kevin在纽约  ·  2025年全球GDP排名,印度上来的速度也不 ... ·  2 天前  
最高人民检察院  ·  被控受贿3.43亿余元,吴英杰受贿案一审开庭 ·  3 天前  
51好读  ›  专栏  ›  知产力

关于使用版权作品训练AI侵权认定及合理使用问题分析

知产力  · 公众号  · 法律  · 2025-03-21 16:30

主要观点总结

本文讨论了美国汤森路透诉罗斯公司案,其中罗斯公司使用汤森路透公司2234份Westlaw判例摘要训练自创的AI,但法官最终判决认定其不满足合理使用四要素,构成版权侵权。案件涉及法律、科技界对AI训练版权问题的争议,具有参考意义。文章分析了案情背景、诉讼进程、判决内容,并探讨了合理使用四要素的适用,以及对AI技术发展和版权保护之间平衡的探索。

关键观点总结

关键观点1: 案情背景

汤森路透公司是信息服务供应商,其Westlaw平台包含大量判例和法律材料。罗斯公司使用其判例摘要训练AI,被指控未经授权复制内容。

关键观点2: 诉讼进程

原告起诉罗斯公司侵犯版权,而罗斯公司抗辩称使用判例摘要是为了开发转换性AI,构成合理使用。

关键观点3: 法官判决

法官最终判定罗斯公司不满足合理使用四要素,构成版权侵权,并指出判决可能不适用于生成式AI。

关键观点4: 合理使用四要素分析

法官分析了使用目的、受版权保护作品的性质、使用数量和实质性相似、潜在市场影响四因素,最终认定不符合合理使用。

关键观点5: 对AI技术与版权保护的思考

文章探讨了AI技术发展对版权保护的影响,并强调需要寻求AI技术与版权保护的平衡。


正文



——以美国汤森路透诉罗斯公司案为例


作者 | 王兴 北京市乾坤律师事务所



【内容摘要】 罗斯公司使用汤森路透公司2234份Westlaw判例摘要训练自创的法律服务AI,法官在2023年判决中,倾向于认可罗斯公司引用“中间复制”相关判例来证明自己也是合理使用。但在2025年判决中,法官进行了修正,认为罗斯公司不满足美国版权法规定合理使用的四要素,构成版权侵权。


【关键词】 AI训练、判例摘要、版权、中间复制、合理使用



当下,法律、科技和文艺界对未经许可利用受版权保护作品训练AI是否侵权,是否为合理使用等问题都极为关注,存在广泛争议。2025年2月11日,美国第三巡回上诉法院斯蒂芬诺斯·⽐巴斯(Stephanos Bibas) 法官针对汤森路透公司和西部出版公司(Thomson Reuters Enterprise Centre GMBH and West Publishing CORP.,以下简称TR公司和WEST公司)诉罗斯信息公司(Ross Intelligence INC.,以下简称ROSS公司)案作出简易判决,认定ROSS公司利用TR公司Westlaw系统的判例摘要训练其AI系统构成版权侵权,不是合理使用。此判决为类似争议的解决提供了参考,本文进行分析。



一、案情背景简介


TR公司是全球知名的信息服务供应商,提供法律、税务、科技、风险管理等商务和专业智能信息服务,主营地位于瑞士楚格。 (注1) WEST公司主营地位于美国明尼苏达州伊根市,所运营的综合性在线法律信息平台Westlaw包含大量判例、州和联邦法律法规、法律期刊论文,以及WEST团队编辑组织策划的专有法律材料等,是美欧律师和法官们的重要工具。 (注2) Westlaw内容版权归TR公司所有。


ROSS公司是一家开发法律领域AI的初创公司,由毕业于加拿大萨斯喀温彻大学法学院的多伦多律师安德鲁·阿鲁达(Andrew Arruda),毕业于多伦多大学的计算机专家吉莫·欧比亚杰尔(Jimoh Ovbiagele)和帕尔格尔斯·达洛吉奥(Pargles Dall'Oglio),三人在2014年共同成立。ROSS公司开发的AI程序(以下简称ROSS或ROSS系统)可以让律师用自然语言,而不是布尔术语(Boolean terms)或关键词向ROSS系统询问法律问题,检索相关法律、案例摘要和案件处理方法,ROSS通过阅读法律、判例和证据,进行推理并输出答案。该AI程序能简化法律研究,节省律师时间和客户金钱。大成律师事务所(Dentons)的协作创新平台Nextlaw Labs最早投资ROSS公司;ROSS公司在2015年获得430万美元种子轮融资后,又在2017年获得了870万美元A轮融资。 (注3) 诉讼时,ROSS公司是根据美国特拉华州法律组建并存在的公司,受本案影响,ROSS系统于2021年1月25日关闭。 (注4)


ROSS公司为创建法律服务AI,需要获取大量法律、判例和法律内容描述等法律材料,以及组织法律内容的方法进行训练。TR公司拒绝ROSS公司获得Westlaw使用许可后,2017年,ROSS公司与法律服务公司LegalEase合作构建数据集以训练其AI,而LegalEase与TR公司有长期合同关系并有访问Westlaw授权。原告指出:2017年7月之前,LegalEase平均每月约有6000笔Westlaw交易;2017年7月之后,LegalEase的Westlaw使用量激增,最后高达到每月约236000笔交易,增加近40倍,比美国排名前100律师事务所的平均月使用量高出近五倍;调查显示LegalEase某些账户使用机器人软件程序批量下载存储Westlaw内容。LegalEase解释正与一家机器学习法律研究公司(后来发现是ROSS公司)合作,为其提供大量数据以帮助创建新的法律研究产品。2018年1月,WEST公司起诉LegalEase并向ROSS公司送达传票,还申请法院强制ROSS公司出示与LegalEase的合同和使用LegalEase提供的数据情况。2020年5月4日,WEST公司与LegalEase在明尼苏达州法院达成同意判决和约定永久禁令;LegalEase同意禁止其复制Westlaw内容、使用机器人访问内容和共享其Westlaw许可的禁令。两天之后,TR公司和WEST公司起诉ROSS公司。



二、诉讼主要进程


2020年5月6日,两原告在特拉华州法院对ROSS公司提起 版权侵权 侵权性干扰 合同 两项诉讼。 (注5) 诉状称:WEST公司创建Westlaw内容,其中包括独特的West关键编码系统(West Key Number System,以下简称WKNS)和West判例摘要(West Headnotes,诉状中将此二者统称为Westlaw内容);版权所有人TR公司拒绝ROSS公司访问并使用Westlaw内容研究竞品后,ROSS公司“明知和故意诱使”(intentionally and knowingly induced)LegalEase违反其与WEST公司的合同,非法复制原告受版权保护内容并将分发给ROSS公司。ROSS公司复制原告内容并基于此创建衍生作品构成直接 版权侵权 ,WEST公司和LegalEase之间存在近十年的有效合同关系,ROSS公司诱使LegalEase违反合同复制下载Westlaw内容构成 侵权性干扰合同 ;诉请寻求禁令救济和损害赔偿。


2020年7月13日,ROSS公司以原告没有复制版权材料证据和侵权性干扰合同已过诉讼时效为由,向法院提交驳回TR公司的动议(motion)。8月10日,TR公司对该驳回动议提交答辩状。


2020年12月14日和2021年1月25日,ROSS公司向法院提交答辩反诉状和修改的答辩反诉状。ROSS公司反诉称:83%的美国律师事务所有Westlaw许可账号,全美营收前100的律师事务所中此比例高达95%,TR公司在法律研究市场形成垄断;TR公司通过限制性许可、排他禁令、虚假诉讼索赔等方式维护 垄断控制 ,其不公平竞争行为违反了谢尔曼反垄断法(the Sherman Act)第2节和第1节规定;此外,Westlaw平台存在捆绑公法数据库和法律检索工具(反诉状统称为法律检索工具)的 搭售行为


2021年3月25日,TR公司针对ROSS公司反诉提交答辩状。3月30日,特拉华州联邦地区法官伦纳德·斯塔克(Leonard P. Stark)认为TR公司的版权侵权诉讼符合:索赔主体的原始作品、是作品版权所有权人、在版权局注册、ROSS公司被控侵犯版权行为四要素。法官对ROSS公司要求驳回TR公司版权侵权的动议,作出简易判决(memorandum opinion)予以驳回。


2022年4月25日,斯塔克法官对ROSS公司反诉垄断作出简易判决:没有证据表明TR公司通过虚假诉讼索赔以维持垄断,ROSS公司基于谢尔曼法第2节的反诉不成立;但ROSS公司根据谢尔曼法第1节反诉TR公司搭售垄断继续审理。


斯塔克在2022年被任命为联邦巡回上诉法院法官,本案由⽐巴斯法官审理。2023年9月25日,⽐巴斯法官在简易判决 注6) (以下简称2023判决)中认定ROSS公司事实上至少复制了Westlaw部分判例摘要;但ROSS公司是否侵犯版权,是否存在实质性相似,是否为合理使用等争议焦点,需由陪审团裁决。双方在诉状及答辩中也都同意“本案可由陪审团裁决的问题,则请陪审团裁决”。


诉讼期间,双方动用了多名法律和AI专家证人提供证词/专家意见。2024年8月2日,⽐巴斯法官对双方专家证人的意见作出简易判决:TR公司专家乔纳森·克雷因(Jonathan Krein)介绍选取对比数据(ROSS公司数据集与Westlaw判例摘要)的方法,以及实质性相似分析方法,尽管其结论认为“可能不是完全复制的”,但法院只要求专家的方法可靠性,而不是使用“最好的方法或无懈可击的研究”,且克雷因的方法没有不可靠的明显瑕疵或让陪审团感到困惑;TR公司专家詹姆斯·马拉科夫斯基(James Malackowski)关于版权侵权损害赔偿(实际损害赔偿+侵权者利润/法定损害赔偿)的法律意见有帮助;ROSS公司专家芭芭拉·弗雷德里克森-克洛斯(Barbara Frederiksen-Cross)引入新观点的法律报告在之前就已完成且不会损害TR公司; (注7) TR公司专家艾伦·考克斯(Alan Cox)关于侵权方收益(总收入及扣减成本、费用)和被侵权方利润损失计算,没有充分界定、解释或说明数据集之间的差异,其意见不可靠。法官采信克雷因、马拉科夫斯基和弗雷德里克森等专家的意见,同意排除考克斯的意见。


2024年9月27日,⽐巴斯法官作出不支持ROSS公司反诉TR公司搭售垄断的简易判决。法官认为:非法搭售必须是两个独立的产品且需定义各产品的相关市场;ROSS公司以TR公司线上销售公法数据库曾经以印刷书籍形式出售,类比二者是独立产品的证明错误;若按此,在线搜索工具也好比是印刷书籍搜索工具——目录、索引和页码;此外,如同马车演进为汽车,现今以汽车为主要交通工具(马车虽存在,仅为娱乐),印刷书籍形式的公法市场存在,并不意味着在消费者易于理解使用的网络搜索工具世界里,仍然存在单独的公法市场,极少有用户将两者分开。


2025年2月11日,⽐巴斯法官作出简易判决 (注8) (以下简称2025判决),认定ROSS公司侵犯了Westlaw判例摘要版权,驳回了ROSS公司合理使用的抗辩。



三、本案判决版权侵权分析


本文主要讨论ROSS公司使用版权作品训练AI所涉侵权和合理使用问题,对原告“侵权性干扰合同”诉请和ROSS公司反诉不做分析。


(一)原告的诉请和主张


长久以来,WEST公司聘请律师编辑总结法律关键点,撰写和原创性的判例摘要。同时,通过WKNS独有的层次结构顺序和分类编码方法,把法律问题、判例摘要及判例、法律规定组织链接起来,在Westlaw平台输入检索法律问题的关键词,相关法律主题、判例信息等以结构化形式呈显。起诉状附图并举例:“遗弃和丢失的财产”主题中关键编码是“性质和要素”“供陪审团参考的证据和问题”及“实施和效力”;而“性质和要素”主题关键编码又包括“概述”“意图”及“作为与不作为”等法律问题和原则相关子主题;其中“概述”关键编码为1k1.1,当前共收录了603个相关判例,每个判例又有一个关键编码。点击关键编码可显示相同判例列表,点击判例摘要可显示在判例文书中对应段落。WKNS可使案例、主题、法律问题等无限组合排列,给用户提供精准法律导航,让法律研究变得高效轻松,是Westlaw搜索工具的支柱。Westlaw平台每天增加无数新判例,编辑律师定期审查判例摘要和 WKNS以确保准确性,原告为此投入大量人力、时间、金钱,TR公司每三个月向美国版权局注册一次数据库。因此,Westlaw内容具有原创性和创造性,是受版权保护作品。


LegalEasel因只提供法律研究和写作支持服务,与Westlaw不形成竞争,从2008年起就获得Westlaw访问许可。双方服务协议明确禁止LegalEase在WEST产品或网络上运行或安装任何计算机软件,禁止向第三方批量销售、再许可、分发、显示、存储或传输Westlaw信息。ROSS公司训练其创建的法律服务AI需要获取大量法律内容、内容描述和组织法律内容的方法,在没有访问权限情况下,明知和故意诱使LegalEase下载储存Westlaw内容。根据美国版权法(1976)/美国法典第17卷第101条规定,ROSS公司未经授权复制和使用Westlaw内容创建竞品系故意、恶意,且全然无视原告权利,应承担版权侵权直接责任(Direct liability)、帮助责任(Contributory liability)和替代责任(Vicarious liability);对诱使LegalEase侵权承担替代责任;损失赔偿包括律师费、ROSS公司因侵权而获得的任何收益、利润、优势及法定赔偿,其中ROSS公司侵权所获收益包括但不限于显著降低开发成本。


(二)ROSS公司的抗辩


ROSS公司开发的是基于AI且更先进强大的自然语言搜索引擎,在判例文书等法律材料的实际文本中寻找自然语言训练AI,而不依赖于体现法律文本的概念列表(如判例摘要)。根据美国法典第17卷第102(b)条规定,版权作品必须是原创性且富有创意的作品,原创性要求作品源自作者而不是从过去来源复制,创意则要求作品具有超越平庸或琐碎的“火花”;判例摘要两者都不具备。它只是对不受版权保护的判例文书和法律法规中有关主题、规则、概念的直接复制引用、背诵或注释;即便证明判例摘要与判例文书文本间有细微差异,这种“明显和典型”的选择也不应得到版权保护,否则使WEST对判例文书的商业出版产生垄断。


WNKS按字母顺序排列法律主题和子主题(子主题包括基本法律文本定义、法律分析和推理中通常概念等),根据主(子)题出现顺序依次分配关键编码完全是基于功能考虑。由功能考虑决定如何以普通法法律制度规定方式,使用传统的法律分析、推理模式和属于公共领域的判例,这种法律分析内在体系和常见方法是法学院一年级学生就要学到的,也是律师面对新案件和法律问题所必须做的。WNKS结构反映了基本法律本身如何组织、法律的构成要素和思想,之所以有效是法律读者、研究人员都可期望和能预见。WNKS整体安排和结构没有原创性或创造性。


原告未证明有版权和复制的事实,未证明复制了作品中受保护的原创元素,仅声称可推断发生了复制事实和两作品有共同的目的或功能是不够的;原告注册版权似乎涵盖了整个Westlaw数据库,包括判例、教学大纲、判例法段落,而这些不是版权法保护范围。根据合理使用原则四要素,原告没有证明本案可排除合理使用原则;ROSS公司或LegalEase的行为属于合理使用,不构成直接或间接侵权。


(三)法官认定的事实


比巴斯法官在2023和2025判决中认定:ROSS公司为了研发法律领域AI,申请Westlaw许可被拒后求助于LegalEase;ROSS公司委托LegalEase创建包括大约25000个问答的批量备忘录(Bulk Memo),每个备忘录有一个律师会问到的法律问题和4~6个答案,答案直接引自判例文书并有相关性评分。LegalEase开始手动创建、后通过文本抓取机器人创建备忘录,ROSS公司将备忘录转换为可用于AI训练的数据,该过程首先将书面语言编码为数值化数据,然后通过特征生成器(Featurizer)对文本执行多种数学……运算。这套程序核心源于批量备忘录。ROSS公司承认判例摘要影响了备忘录的“问题”,但表示是律师最终起草而非复制这些问题。TR公司则称25000个备忘录都是复制(备忘录的“问题”基本上是在判例摘要末尾加上问号),TR公司只对两个子集的判例摘要(分别包含5367份和2830份)申请简易判决,侵权索赔仅限于2830份备忘录。专家弗雷德里克森报告中包括3384份判例摘要(含TR主张且陪审团认定版权有效的2830份判例摘要,以及TR公司未列入侵权但ROSS公司专家认定且ROSS公司作出回应的判例摘要)。 比巴斯法官仔细对比3384份判例摘要后,认定ROSS公司实际复制2243份。 此外,LegalEase向ROSS公司发送了一份来自WKNS的91个法律主题清单,和500份包括Westlaw判例摘要、关键编码及注释的判例;ROSS公司承认在创建实验项目(项目最终放弃)的38个主题时考虑了该清单,而判例则没有什么作用。


(四)法官两次判决对比


比巴斯法官认为版权侵权索赔有三要素: (1)有效版权的所有权;(2)实际复制;(3)实质性相似。 法官在2023判决认为第2个实际复制要素存在,而第1、3个要素需由陪审团裁决;在2025判决中则认定Westlaw判例摘要、关键编码有原创性而版权有效,备忘录“问题”与2243份判例摘要实质性相似。


比巴斯法官认为,根据美国法典第17卷第107条判断合理使用的四因素: (1)使用的目的和性质;(2)受版权保护作品的性质;(3)与受版权保护作品整体相关的使用数量和实质性相似;(4)对受版权保护作品潜在市场影响。 其中第1个和第4个因素最重要的,2023判决将四因素都交陪审团裁决;在2025判决则判定TR公司在第1、4两因素获得支持,并在整体因素平衡方面占上风。


比巴斯法官在2025判决中用略带自省和谦逊的语气解释为何修正了2023判决。现就法官两次判决中关于版权侵权及合理使用认定分析对比如下。


1.版权侵权认定三要素的两次判决对比


(1)关于Westlaw内容版权范围及有效性


法官在2023判决表示:ROSS公司主张Westlaw注册版权为汇编作品,包括数十万个判例摘要和WKNS,仅仅复制几千个判例摘要不足以构成侵权;ROSS公司的观点很难得到支持。汇编作品版权延伸到所汇编的受版权保护作品(汇编组件),汇编作者通过原创文字陈述事实,他人可以复制其中基本事实但不能复制呈现事实的确切词语;汇编组件虽属于不受版权保护的公共领域,但汇编人对选择、组织编排材料的方法是有“薄弱”版权,尽管“原创性门槛很低”。因此,WKNS的原创性、是否受保护、受何种保护范围等争议由陪审团决定。TR公司主张判例摘要是其律师编辑原创(总结案件重要事实、突出关键问题、描述证据),ROSS公司则举证证明TR公司要求判例摘要“遵循或密切反映判例文书的语言”,此争议涉及ROSS公司复制的是判例摘要还是判例文书; 判例摘要表达了不受版权保护的判例文书,其版权强度取决于判例摘要与判例文书的重叠程度。 如果仅是复制判例文书则无版权,若判例摘要是“雕凿”判例文书且是比“微不足道”更大变化的简短书面作品,则版权有效。必须在每个判例摘要层面而不是Westlaw汇编层面上考虑判例摘要版权侵权问题。


法官在2025判决认为:版权有效性是法律问题而非事实问题,原创性是版权核心但门槛较低,只要“最低限度的创造力……一些创造性的火花”而非“额头汗水”。首先,汇编者使用“最低程度的创造力”对事实(判例文书)进行选择和安排,事实汇编满足原创标准。其次,不受版权保护的判例文书就像一块大理石原料,雕刻家通过选择判断切凿掉什么、留下什么,创作成为受版权保护的雕塑;Westlaw编辑律师从冗长判例文书中逐字摘录形成每份判例摘要,也是从整体中精心挑选和确定重要词句(如同雕凿石材原料),并通过提炼、综合或解释观点引入创造性,表达对判例文书重要观点的想法,这有足够“创意火花”而具有原创性;且每份判例摘要都是独立的、受版权保护作品。 我改变之前认为原创性取决于判例摘要和判例文书之间重叠程度的错误观点, 但不会对任何逐字复制的判例摘要做出简易判决。组织法律主题、法律问题有许多可能、合乎逻辑、按不同粒度级别的常见方法,TR公司选择一个特定类型并独立创建,也具有最低限度的原创性“火花”而无需强调新颖性(novel)。所以,WNKS也是原创的。


(2)关于实际复制问题


法官在2023判决表示:实际复制考察重点是ROSS公司是否使用了受版权保护作品创作自己的作品,真正独立创作的作品,无论相似性如何都没有侵权。TR公司可提供直接证据和间接证据——LegalEase承认直接复制了部分判例摘要,ROSS公司不否认LegalEase访问了Westlaw判例摘要,陪审团也没有说这些相似之处至少不能证明某些复制。在法律上,ROSS公司实际上复制了判例摘要部分内容。


法官在2025判决认为:在评估复制时我会考虑专家意见;弗雷德里克森专家分析报告指出本批次(3384份)备忘录的“问题”与判例摘要文本非常相似,且判例摘要与判例文书有很大不同;专家意见表明这些备忘录“问题”是复制判例摘要,而非通过总结基本观点所创建,这是有力的实际复制间接证据,陪审团没有不同结论。因此,LegalEase访问权加上这些判例摘要的相似性分析,我认定2243份实际复制。


(3)实质性相似问题


法官在2023判决表示:版权侵权认定实质性相似是一个非常接近的事实问题,需要“善于察觉和常识”(good eyes and common sense),要站在普通消费者视角来看待作品差异和美学吸引力。批量备忘录与判例摘要有共同的潜在来源——判例文书,因此,(a)需要确定ROSS公司的工作与TR公司受保护表达(而非观点)是否基本相似;(b)双方产品的普通消费者都是律师,应该适应律师可能注意而外行没有注意到的差异;(c)第三巡回法院(通常)拒绝专家关于实质性相似意见,所以,我不太关注各方专家对此问题的意见。TR公司所列实质性相似判例摘要是否为受保护的表达,批量备忘录的问题复制这些判例摘要是否构成侵权,由陪审团裁决。


法官在2025判决认为:作为律师和法官,我也是Westlaw判例摘要的普通用户,完全有能力确定实质性相似,并对陪审团无法得出相反结论的那些判例摘要进行审查。我采纳第九和第二巡回上诉法院有关判例中的概念:作品包含的可保护表达越不容易受到保护,被控侵权作品必须与它越相似。按此标准,2243份判例摘要和批量备忘录“问题”用语基本相似且如此明显(而不是判例摘要与判例文书用语相似),这些判例摘要实质性相似。


2.认定合理使用四要素的两次判决对比


(1)使用的目的和性质


法官在2023判决表示:为盈利的商业性使用不满足合理使用,而传达了与原始内容不同的新事物或扩展其效用的转换性使用有利于增加公共知识,是合理使用。TR公司引用沃霍尔视觉基金诉戈德尔史密斯案, (注9) 主张ROSS公司是与Westlaw竞争的商业性使用不是合理使用。ROSS公司描述批量备忘录转换处理过程:(a)将接收的批量备忘录存入数据库;(b)将简明语言条目转化为数字数据;(c)这些数据被输入机器学习算法用以训练AI理解法律语言。其AI的核心理念和逻辑在于:通过分析“问题-答案对”(the question-answer pairs)的模式特征不仅能回应预设问题, (注10) 还能识别潜在规律,从而应对用户提出的各类法律问题(即便这些问题在初始训练数据库中没有)并给予反馈。ROSS公司引用世嘉公司诉Accolade案 (注11) 、索尼公司诉Connectix案 (注12) 和谷歌诉甲骨文案 (注13) 等“中间复制”判例,这些判例都使用复制材料作为输入,但复制材料是为了发现不受保护的信息,或是开发全新产品的一小步,最终输出是转换性的,ROSS公司复制用途与判例相似。TR公司认为这些判例的复制者试图“研究功能或创造兼容性”,而ROSS公司复制Westlaw的创造性内容训练AI。







请到「今天看啥」查看全文