专栏名称: 网络空间治理

专注网络空间治理领域(包括但不限于法律、战略、技术、管理)的理论与实务。

孙远钊：论人工智能生成内容应否享有著作权

网络空间治理 · 公众号 · · 2024-04-18 15:21

正文

原文刊载于《版权理论与实务》2024年第3期，原标题为《 论人工智能生成内容应否享有著作 》，转载请注明出处。文章注释从略，完整原文请见《版权理论与实务》纸质版。

【扫描下方二维码即可订阅2024年全年《版权理论与实务》杂志。欢迎订阅！欢迎投稿！】

【内容提要】 本文以追本溯源的方式回探著作权保护体系的“基本面”与其中的若干核心概念，以期能正本清源，再以此探索人工智能生成的内容（包括北京互联网法院近期判决的“文生图”侵权案）是否有获得版权保护的可能抑或有其他的途径？其中的种种问题为何？究竟作者与独创性的要求如何适用到以人工智能作为主要创作工具的情形？本文尝试综合国际与国内的发展与见解从事比较性的研究和探讨，并提出相关的结论。

【关键词】 人工智能；文生图；作者身份；独创性；“春风送来了温柔”案

一、引言

所谓“万变不离其宗”。 [1] 在武术（太极拳）当中也有非常类似的核心观念：“虽变化万端，而理为一贯”。 [2] 其实不分文武，这个中心思想同样适用到研究法律问题的方法，也包括了著作权 [3] 和其他的知识产权，其主要的意思是，审视问题必须回到并从基本面来着眼和探讨，唯有追本溯源才能正本清源并以此稳步推演应如何与时俱进。 [4]

1710年英国国会通过《安娜法》（Statute of Anne），是近代保护著作权的滥觞。 [5] 经过三个世纪的不断演化，尤其是在数波工业革命当中无数新科技的挑战与考验，当前的著作权法虽然仍有不少的问题，但是基本的结构、组织、肌理、宗旨和导向都已发展得相当成熟和完整。现代著作权保护体系的“本”至少包含了四个面向：（一）从对出版商的保护转化为对作者的保护；（二）从无期限的公权垄断保护转化为有期限的私权保护；（三）从几近绝对的排他权转化为相对的排他保护，必须兼顾作者权利和社会公益之间的微妙与动态平衡；（四）从各自为政转化为全球一致的标准，必须符合国际公约规定的最低强制标准。 [6]

目前全球各国或地区的著作权法制也就是在由这四个面向组成的基础上衍生出了对作者在多久期间内可享有人格权与财产权的规制、以是否为作者的独创表达作为能否享有著作权的前提、以及在哪些情况下是否基于某些特殊社会公益的需求必须要求这些权利作出某种程度的退让以平衡社会的需求或经济的发展。换句话说，独创性、保护主体（作者身份）与合理使用（或“权利限制”）是当前只要涉及著作权的问题就难以规避且必须通过的“槛”。

当现代计算机和人工智能都还在萌芽发展的20世纪60年代，就已有学者展开了关于人工智能与著作权问题的讨论。 [7] 经过半个多世纪的研究和探讨，已确定无论如何都无法绕开这三个主轴。由于合理使用只在涉及侵权时作为抗辩的手段，因此本文将聚焦探究前两者，并兼论其他相关的问题。

二、独创性

传统上凡是由机器自动生成的内容，无论是文字、字型、图像、排序等等，基本上无法享有著作权的保护。这是基于一个影响了全球著作权法制发展的经典案例而来，即美国联邦最高法院（United States Supreme Court）于1991年判决的“白页电话号码簿案”，首次明确了“独创性” （original authorship，也称为originality，或译为“具独创的作者身份或资格”更符合原意）是获得著作权保护的最基础要件并界定了其具体的内涵为何。 [8] 法院在该案判决，虽然被告大量复制了原告的电话簿，但其中的具体内容（姓名、地址、电话等）都是由没有任何权利的“事实”组成，即使按字母顺序排列也是本当如此，实际上则是透过电脑操作“一键完成”，即使连微量的创意都不具备。联邦最高法院进一步表示：

“在考量一个以事实为基础的产物是否构成具有独创性的作品时，〔法院〕应聚焦在被收集的事实是如何被筛选、协调和安排。……事实永远不具独创性，因此对其从事汇编的作者只能从其如何呈现来主张独创性。……独创性的要求并不严格。……并不要求创新。独创性只要求作者独自从事了筛选或安排（亦即没有复制其他作品的选择或安排），而且展示出了某种最低程度的创意。” [9]

法院在判决书的最后强调，此一判决无论如何不可被解读为对原告汇编其电话簿的贬抑，而是要表明，著作权是对作者创意而非努力的奖励。

据此，美国版权局一直以来的政策是：凡是没有任何人类的创意输入或介入，仅由机器或机械的程序随机或自动生成的内容都不给予版权登记。 [10] 其中的关键在于，一个“作品”的作者是否基本上为自然人，其所使用的电脑或其他装置是否仅作为辅助工具，抑或作为判定作者身份或资格（authorship）的传统要件（文学、艺术或音乐等表达或是筛选、安排的元素等）实际上并非自然人，而是由一个机器或系统来构想和执行，因此仍无法跨过对独创性要求的最低门槛。 [11]

在欧洲联盟，欧盟法院（Court of Justice of the European Union，简称CJEU）自2009年起先后出台了7个与著作权独创性直接关联的判决，目前与美国的司法见解已基本趋同。 [12] 欧盟法院表示，依据欧盟历来与著作权相关的指令（尤其是2001年的《信息社会指令》Information Society Directive），“作品”的意义首先是指具有原创（或独创）的标的，也就是只能是源于作者自身的智力创作并反映了该作者的个性。 [13] 其次，要符合“作品”必须由该智力创作的表达所构成。反之，如果一个创作只是由技术限制或规则所决定，那么该创作便不具有独创性。法院表示“作品”的概念必须存在相当精确与客观的意涵从而足以识别的物件，亦即必须“固定”或“附着” （fixed）。法院最终明确表示，任何欧盟成员国的国内法在规制赋予著作权的保护时，凡是对“作品”有独创性以外的其他要求（如具有一定的美学或视觉效果等）都不符合欧盟的法律。 [14]

三、作者身份（主体）

与独创性要件环环相扣的另一个要件是作者的身份或资格，也就是著作权所要保护的主体。

在国际规范方面，如《伯尔尼保护文学和艺术作品公约》（The Berne Convention for the Protection of Literary and Artistic Works）和世界贸易组织的《与贸易有关的知识产权保护协定》（Agreement on Trade-Related Aspects of Intellectual Property Protection，即《TRIPS协定》）等主要的法律文件都没有对“作者身份”给予定义。不过据山姆·里基森教授（Sam Ricketson）的研究，在各国协商缔结1967年《伯尔尼公约》（斯德哥尔摩文本）的协商过程中，“各成员国基本上都同意这个名称的意义，也因此认为没有必要再去定义……因此对于关于公约中‘作者’或‘作者身份’唯一合乎逻辑的解释是指创造作品的自然人”。 [15] 不但如此，里基森教授还指出，如果调研《伯尔尼公约》的条文字句便不难发现，贯穿和支撑其中绝大多数规定的主轴（leitmotiv，或主旋律）就是指人类（自然人）的创作。例如，著作权的保护期间是作者有生之年加上去世后的50年，显然是指自然人，不是机器（虽然基于节税和科技淘汰等各种原因，机器可能会更早就折旧报废了）。 [16]

在国内法或地区法方面，美国《著作权法》也没有明文规定，但是司法与美国版权局的实践都已确立了人本主义，也就是作者的身份必须是自然人。 [17] 法国著作权法（规制于该国《知识产权法典》（Code de la propriété intellectuelle）第一编）开宗明义在第一条确立了著作权作者的人格属性和权利（机器显然没有人格可言）； [18] 另对于若干类型的作品（如协作或合作作品、视听作品等）则明定作者必须是自然人。 [19] 此外，法国最高法院于2015年出台的一项判决也强烈暗示版权的作者是专属于自然人。 [20]

德国《著作权法》明定“作者”是作品的创作人。 [21] 西班牙《知识产权法》第一编（即著作权法）第一条和第二条规定也明确了“作者”必须是自然人。 [22]

在澳大利亚，其上诉法院以全院审的方式于2010年出台了一个经典判决，明确拒绝给予由人工智能自动生成的数据库（电话簿）著作权保护。 [23] 至于欧盟法院则是从其2009年的Infopaq案判决便已确立了受著作权保护的作品必须是源自“作者自身的智力创作并具有独创性”。 [24]

比较特别的是英国。其1988年《著作权、设计及专利法》第9条第（3）款对作品的作者身份（authorship of work）规定：“由计算机（或电脑）生成的文学、戏剧、音乐或艺术作品，其作者为对于作品创作从事必要安排的个人。”另在第178条特别对“计算机（电脑）生成作品” （computer-generated, in relation to a work）定义为：“指由计算机（电脑）在没有人类作者的情况下所生成的作品”。 [25] 当这个法于1987年还在英国国会下议院进行审议时，当时的贸易和工业大臣格拉夫汉之杨勋爵（Lord Young of Graffham）表示，身为起草者，第178条新增的定义“是全球任何地方首个试图针对人工智能的到来给予版权立法。” [26]

如果只为了显示一个法律的制定具有“前瞻性”就简单地去定义，往往会落下好些将来难以处理的问题。这里的状况是，一旦把上述的两个条文并列，再加上独创性的要求，就可看到彼此之间方枘圆凿，无法调和。可以确定的是，依据英国现行的成文法，无论任何作品都至少要有一名自然人“作者” （主体）；如果是电脑系统自动生成的内容，其作者要么是整个人工智能系统的创造人或开发者（但对于透过该程序系统生成的各种物件却几乎没有任何直接的参与或关联），要么就是对于产出特定生成物从事必要创作安排的人。目前还没有出现任何对此直接给予答复的司法判决。 [27]

英国政府在其2021年针对人工智能与版权问题展开的专项咨询已然认知了这个问题。 [28] 然而在翌年6月提出的结果报告中，一方面承认这是个非常具有挑战性的难题，另一方面却以人工智能发展仍在“早期发展阶段”、不可能进行适当的评价为由，不认为在现阶段对版权法进行修改能提供任何的实益，因此决定搁置暂缓，以待将来时机成熟时可再返回检视。 [29] 英国政府显然未能看到（事实上恐怕当时也无人能够预料）原来时机就在当下：在其报告出台的前两个月，一家位于美国加州旧金山市，名叫OpenAI的创新公司刚推出了一套名为Dall-E 2、能够从事“文生图”的人工智能系统；5个月后该公司又推出了另一套名为ChatGPT的系统，结果快速“引爆”了全球开发和运用人工智能系统的浪潮，也把包括版权在内的各种问题推上了风口浪尖。

无论如何，即使如英国对其自身法律规定的定义和范围都还未能确定，从上述的比较过程应可至少确定一个基本原则：一个自然人的创作过程（creative process）为何是考量该自然人对某个特定的表达（或作品）是否具有作者身份的关键；至于是否能享有著作权以及相关的范围应当为何则需视该独创表达的结果为何而定。 [30]

四、作者独创表达/“贡献度”

自然人的创作是依据自身的常识、经验、情绪、感知和想像来表现，人工智能系统（尤其是当前通行，以仿人类卷积神经网络（Convolutional Neural Networks）设计的大模型）则是完全依据从其输入端置入的数据（或数据集data set），透过软件程序的运算然后自动生成（亦即不再有任何人为因素的介入）特定的内容。固然两者都从“一张白纸”开始，要经历各种的“学习”过程，其中的实质内涵与对信息的转化、处理方式却是截然不同。其中的一个主因是，人工智能完全不具备常识，因此固然在接受过“学习”或“训练（优化） ”的特定领域可从事非常深入、细致，而且远超人类能力所及的工作，却无法“触类旁通”，从事各种横向的关联思考与领悟。 [31] 其中的关键是，固然程序设计者可以在每次的系统运算或操作之前先行设定所要处理的各种参数（parameters，包括如何的条件与范围等等，也称为“提示”），整个内容的生成完全是由电脑根据其系统内既有的数据系统和软件预设的统计运算程序自行、自动操作完成。 [32]

也正因如此，凡是涉及到运用人工智能系统的操作，至少在所谓的“文生图”过程，属于自然人的表述仅是每次输入到系统内的参数或提示，与系统最后究竟会生成如何的内容不但没有任何关联，也根本无从预期，更遑论任何程度的掌控。相对而言，自然人对文学或艺术的创作通常从一开始就有某些布局和安排。至于那些表述（提示）能否获得著作权的保护，则依然必须回到基本面，依个案情形分别检视是否具有独创性；至于完全由机器或系统自动生成的内容，则显然没有任何著作权可言。

以近期在国内引起了极大的兴趣和讨论，由北京互联网法院判决，由人工智能生成的图像侵权案（“春风送来了温柔”案）为例。 [33] 法院在判决书中详列了原告对Stable Diffusion这套人工智能系统输入的参数（或提示，见下图）。

从中可见，有自然人参与或介入的部分就是到此为止，而这也正完整反映了原告的表述内容。其中并没有任何与最终呈现画面相关的构图、透视或素描等等属于美术创作的不可或缺的基本框架或内涵。诸如“超高品质高细节的原始图像数据处理格式彩色照片，外景，日本偶像，高度细节对称且迷人的脸，棱角匀称的脸，完美的皮肤，皮肤毛孔，梦幻般的黑眼睛……”等等，无论从个别或整体以观，无非只是各种普通、常用的形容词与纯功能或相当主观的表述（依著作权法的术语，都还在“思想”的阶段），不具备最起码的独创性，也就不构成“表达”，没有著作权可言。

反过来说，如果退一万步，就先假定原告享有著作权，那么其权利的范围为何呢？其实应该也非常清楚，就是原告给出的那些参数指令或提示。除非被告也使用了相同或实质近似的参数指令（提示），依然没有任何的侵权行为可言。无论如何，原告无法对一个完全是机器系统自动生成的内容（在本案是多帧图像）竟然还能主张是那些图像内容的“作者”。

这里有个很容易进入的误区，是所谓“贡献度”的问题。由于在判认哪个部分的作者为谁的过程中没有站稳基础，也就是从一开始就没有把完全属于机器或系统自动生成的部分分开排除，于是很自然的就会变成要考量给出参数指令或设置人工智能系统的自然人对最终的生成内容具有多大程度的“贡献”。须知在著作权的领域，唯一会涉及到“贡献度”问题的，是共同作者必须拆分利润的情形，而那也只是一个概估罢了。所谓的“贡献度”本身就有高度的误导性，实际上是根本难以甚至无法被量化，尤其无法以百分之几来衡量或计算。例如俗语所说的“画龙点睛”，对于最后拿根笔只轻轻地在龙眼上点了一下的那个人来说，他（她）的“贡献度”有多大？占比又有多高呢？

不过法院在“春风送来了温柔”案的基本论述和逻辑是，“原告对于人物及其呈现方式等画面元素通过提示词进行了设计，对于画面布局构图等通过参数进行了设置，体现了原告的选择和安排。另一方面，原告通过输入提示词、设置相关参数，获得了第一张图片后，其继续增加提示词、修改参数，不断调整修正，最终获得了涉案图片，这一调整修正过程亦体现了原告的审美选择和个性判断。……因此，涉案图片并非“机械性智力成果”。在无相反证据的情况下，可以认定涉案图片由原告独立完成，体现出了原告的个性化表达。” [34] 按照这样的论述，设想一位教授对其指导的研究生给了一些原则性的建议，然后看到学生提交的论文初稿不甚满意，于是又提出了一些修改意见，如此经过几次，难道对最终完全由学生撰写完成的论文，该指导教授竟可反成了论文的作者和著作权利人么？这样的结论显然有很大的问题，可以想见不但会让整个著作权的体系乱了套，更会导致对整个教育体系、出版事业等不知多少行业与市场带来严重的后果。

五、固定与可复制性

另一个关联性的问题是固定性（fixation）与可复制性。位于美国纽约市（New York）的现代艺术博物馆（Museum of Modern Art，简称MOMA）于2023年举行了一个关于人工智能生成图像的特展。他们首先提问：如果让一套人工智能系统遍览该馆的所有藏品，之后能“梦想”和自创出什么呢？于是馆方邀请了美籍土耳其裔的多媒体艺术家瑞非克‧安那多尔（Refik Anadol）设计出了一个能永不停息、也永不重复，能随周遭客观环境的改变也不断自我变化的视觉立体呈现，称为“瑞非克‧安那多尔：无人监督” （Refik Anadol:Unsupervised）的特展。全部的画作都以一整面的大屏幕墙（24×24英尺，约合7.32×7.32米）和超高清画素的投影来显示，而且呈现出的立体图像场景会随周遭环境因素不断改变（如晴天、下雨、光线、人群的移动等等，见下图）跟着产生各种变化。 [35]

图片来源：《纽约时报》

因此这也不可避免产生了许多的问题。即使先行搁置能否获得著作权或构成侵权的争论，仅是这些画作究竟应该“归功” （attribution）于谁（如何署名）便可能会引起很大的争议甚至冲突：给出“提示”的人或其聘雇的“提示工程师” （prompt engineer）？人工智能本身？开发该人工智能的人（软件设计者或/和其雇主）？还是提供作为机器“深度学习”的各个对象的作者？其次是，纵使可对人工智能的生成内容考虑赋权，那么对于一个从来没有固定形态、一直不断在变化的呈现要如何赋权？所涵盖的范围究竟应该为何？究竟是二维或三维抑或兼而有之？是否符合著作权法对于“固定”的要求？

在人工智能生成内容是否要赋权的讨论中还有一个经常被提出且让许多学者不断纠结的问题是“可复制性”。 [36] 这个要件之所以被提出，是因为在18、19世纪制定早期的著作权法时，如美国等有配套的版权注册制度，并要求申请人缴交样品存证，因此需要让所有的版权登记申请“固定”于特定的载体从而能确定当事人的具体独创表达为何并且可被复制。 [37] 像大都会博物馆的这项特展，其中的内容既无法固定，也难以复制，因此就算要考虑赋权，实际上根本无从界定其作品的内涵与权利的范围。

这个例子也多少显示，一个以人为本、为激励人类的创作并保育文化资产而设计、发展的著作权法制与一个在设计上想尽可能地模拟人类思维和表达的系统工具原本就已捍格不入。现在却反而想把这个系统工具的生成结果给倒挂、套回到为人类设计的法规制度里，却因为难以套挂又想扬弃著作权法制既有的基础，就显得是“削足适履”了。

六、结论 [38]

“人工智能”迄今还没有一个国际公认的定义，但从各个不同的既有定义中可以归纳出一个共通点：人工智能系统是一种整合模型和算法的信息处理技术。第二届图灵奖得主艾兹格·迪科斯彻