大数据知识产权司法保护的调研报告
——以大数据的产权、模式和伦理为视角
海淀法院中关村法庭课题调研组[1]
主持人:张弓,负责人:陈昶屹
执笔人:郭振华,刘君婕,刘佳欣,游美玲,韩乔亚,陈昱晗
一、大数据知识产权司法保护概述
1、引言
2、大数据与知识产权法律制度的交叉
3、知识产权制度对大数据信息和产业的司法保护概况
4、知识产权司法保护对大数据的促进意义
二、大数据司法实践中的现状
1、民事案件
(1)隐私权纠纷
(2)名誉权纠纷
2、知产案件
(1)著作权纠纷
(2)不正当竞争纠纷
(3)技术服务合同纠纷
三、现有知识产权法律框架下对大数据的保护
1、数据采集与预处理阶段的保护
2、数据存储和管理阶段的保护
3、数据处理与分析阶段的保护
4、数据成果呈现与应用阶段的保护
四、大数据类知识产权案件疑难问题分析
(一)著作权的保护
1、数据库的著作权法保护
2、大数据软件的著作权法保护
(二)方法专利在大数据保护的构成要素分析
(三)《反不正当竞争法》在大数据类案件中的保护
1、数据库的反不正当竞争法保护
2、商业秘密的保护
(四)数据的垄断和排他
五、大数据司法保护的价值性判断
1、应当遵循人本原则
2、应当遵循适度采集,隔离使用原则
(1)适度采集
(2)隔离使用
3、应当遵循合理避让的原则
4、应当遵循利益平衡原则
5、鼓励数据流动、分享原则
6、遵守法律伦理的原则
1、引言
随着智能信息技术的不断发展,数据已经成为一种新的商业资本和一项重要的经济投入,可以为人类创造出新的经济利益和商业价值。大数据(Big data)作为无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要通过新处理模式才能成为具有更强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[2],俨然成为了人类历史上的又一次信息革命,人类的生活方式、价值体系与社会模式也因此发生了重大的改变。2011年,美国麦肯锡公司发布的报告中显示,各国政府已经逐渐将大数据的发展上升到了国家战略的层面,包括美国政府的“大数据研究发展创新计划”(Big Data R&D Initiative)、欧盟“欧盟数字化议程和挑战”(The Digital Agenda for Europe and Challenges for 2012)、日本发布的“活跃ICT日本”综合战略以及澳大利亚和韩国发布的“公共服务大数据战略”等各种大数据国家战略,这标志着大数据的研发及产业应用已经引起了各国政府的重视,全球的“大数据”时代已经到来。全球领先的咨询分析机构Wikibon于2014年2月发布的《大数据企业营收和市场预测(2013-2017)》报告显示,2013年全球大数据企业(软件、硬件及服务)营业收入为186亿美元,同比增长58%;2014年全球大数据市场增长速度达到53%,总体规模为285亿美元;到2017年,全球大数据市场收入将达到500亿美元,这意味着从2011年起连续6年年复合增长率达38%。中国市场情报中心有关统计显示,2012年中国大数据市场规模为4.5亿元,同比增长40.6%。到2018年,中国大数据市场规模将达到46.3亿元。
2015年9月,我国国务院印发《促进大数据发展行动纲要》,力图全面推进大数据的发展和应用,将我国建设成为数据强国。2017年1月17日,工业和信息化部发布《大数据产业发展规划(2016-2020年)》,该规划以强化大数据产业创新发展能力为核心,明确了强化大数据技术产品研发、深化工业大数据创新应用、促进行业大数据应用发展、加快大数据产业主体培育、推进大数据标准体系建设、完善大数据产业支撑体系、提升大数据安全保障能力等7项任务,明确了“十三五”时期大数据产业的发展思路、原则和目标,将引导我国大数据产业持续健康发展[3]。
大数据系统和大数据产业给人类生活带来了诸多的益处,但随着智能信息技术的不断深入和创新,数据也呈现出日益庞大、类型愈加复杂的趋势。知识产权领域呈现资源急速增长且数据量庞大的特点,在此种情境下,为保障数据产业的发展,保护大数据集合表现形式及其实质内容的价值,究竟该如何基于法自身的价值追求扮演社会规范的角色,运用知识产权相关法律制度来为大数据提供恰当的司法保护,实现大数据与知识产权法律制度的平衡,探究出新的数据知识产权保护模式,是一个值得探讨的问题。
2、大数据与知识产权法律制度的交叉
基于数据本身的可复制传播性和可重复利用性等特点,致使其客观上与知识产权有着千丝万缕的联系。在知识产权法域内而言,其应当是具有财产价值的排他性权利而产生的法律关系。虽然有些大数据产业中的原始数据并是否知识产权法律制度中保护的客体有待厘清,但是如经过相关主体利用技术开发或智力创造加工后转化成为一种新的分析数据或者汇编集合,赋予其一定的独创性,应当视为可以受到法律保护的知识产品。具体而言,与大数据相关的主要知识产权应当包括数据信息的著作权、相关商业模式及操控分析数据的专利权、经由数据转化成为数据产品的商标权以及含有技术信息或经营信息中的商业秘密等。因此,我国知识产权法律体系中的著作权法、专利法和反不正当竞争法均可在一定程度上为大数据信息和大数据产业提供相关的法律保护。在适应新技术革命的基础之上,充分发挥司法保护知识产权的主导作用,从而真正地做到协调与平衡技术创新激励与个人权利的保护之间的关系。
3、知识产权制度对大数据信息和产业的司法保护概况
鉴于大数据集合的复制成本低廉的特征,围绕着大数据的产生和取得方式以及运用和维护的过程,现行知识产权司法保护制度充分发挥着其明确创新权属、协调大数据创新成果各主体利益分配机制的作用。
就数据本身而言,因其难以满足著作权法中关于“具有独创性并能以某种有形形式复制的智力成果”的规定,而难以通过著作权法进行保护。但“数据”的集合往往在其选择或者编排中具有独创性,由此可以通过著作权法中的汇编作品予以保护。世界贸易组织、世界知识产权组织、《伯尔尼公约》以及TRIPS协议都已经明确规定可以将数据信息作为汇编作品予以保护,我国《著作权法》也做出了类似规定。对于大数据信息而言,不为公众所知悉且能为经营者获得利益或者竞争优势、具有潜在商业利益的信息可以归入属于该公司的技术信息或经营信息,可以作为商业秘密[4]通过反不正当竞争法予以保护。我国《反不正当竞争法》第二章第十条明确规定了三种不得采用的手段侵犯商业秘密的行为。由于我国对不正当竞争行为的界定是以举例加概括的形式,因此有些难以成为商业秘密的数据信息还可以通过反不正当竞争法中的一般性条例进行保护。
大数据产业和技术的意义和价值不仅仅在于掌握庞大的数据信息本身,更体现在对具有意义的数据进行专业化的处理,从而实现数据的赋值、增值和价值显现。大数据通过挖掘、整理、计算等方式进行加工之后形成的特定算法或是计算机软件工具,以及通过软硬件与网络结合的系统解决一定的技术问题,此类具备鲜明技术属性的可以通过申请方法专利的方式进行保护[5]。
4、知识产权司法保护对大数据的促进意义
虽然我国现行的知识产权制度实行的是“双轨制”保护模式,即权利人可以通过知识产权行政主管机关主张权益保护,同时也可以通过法院诉讼的方式来维护自身合法权益,但由于知识产权保护的客体作为一种私权以及司法制度本身的制度优势,决定了司法保护知识产权是维护相关权益重要的的方式。
随着互联网、物联网等现代网络技术的发展,大数据作为能够广泛带动各行业向信息化、智能化、网络化发展的力量,已然成了企业,乃至国家的核心竞争力。将符合知识产权特征的数据纳入知识产权体系,建立相关完善的知识产权数据保护模式,运用知识产权司法保护为大数据产业的发展保驾护航,保障数据产业的发展,能够形成一个良性的产业生态圈,促进社会经济的发展。
我国司法实践中有关大数据的案例按照案由来分类主要有以下几种类型:
1、民事案件
(1)隐私权纠纷
①原告王刃与被告北京奇虎科技有限公司隐私权纠纷案。[6]本案中,原告的手机号被被告的360手机卫士安卓版标记为“维特网络信息有限公司(合肥分公)”,被人怀疑为骗子。法院经审理认为,被告出示的证据可以证明原告所使用的号码已经在企业黄页被公开披露,原告在工商行政管理机关登记企业信息时亦将该手机号码予以登记,以备信息查阅,被告通过大数据比对功能,确定该手机号码与浙江维特网络信息有限公司合肥分公司相对应并进行标记,其信息并无错误,且软件标记的企业信息,而非公民个人信息,且庭审过程中显示原告手机号已再无此标记,法院最终认定被告不构成侵权。
②原告朱烨诉被告北京百度网讯科技有限公司隐私权纠纷案。[7]原告认为被告利用网络技术,未经原告的知情和选择记录和跟踪了原告所搜索的关键词,将原告的兴趣爱好、生活学习工作特点等显露在相关网站上,并利用记录的关键词,对原告浏览的网页进行广告投放,侵害了原告的隐私权。一审法院经审理认为,被告未经原告同意通过cookie技术收集和利用原告搜索信息,并根据原告的上网信息在被告合作网站上展示与原告上网信息有一定关联的推广内容,进一步利用了他人隐私进行商业活动,且该利用并非cookie技术使用的必然结果,已经构成侵犯他人的隐私权。二审法院经审理认为,网络用户通过使用搜索引擎形成的检索关键词记录,虽然反映了网络用户的网络活动轨迹及上网偏好,具有隐私属性,但这种网络活动轨迹及上网偏好一旦与网络用户身份相分离,便无法确定具体的信息归属主体,不再属于个人信息范畴;被告利用网络技术通过百度联盟合作网站提供个性化推荐服务,其检索关键词海量数据库以及大数据算法均在计算机系统内部操作,并未直接将被告因提供搜索引擎服务而产生的海量数据库和cookie信息向第三方或公众展示,没有任何的公开行为,不构成侵权。
(2)名誉权纠纷
原告浙江携银在线网络科技有限公司诉被告大公信用数据有限公司、大公国际资信评估有限公司名誉权纠纷案。[8]本案中,被告根据其收集整理的P2P网络借贷企业信用数据在大公资信上发布有关原告携银网的相关不利信息,原告认为构成侵权。法院经审理认为,根据被告大公数据对原告平台的持续跟踪监测,发布的报告涉及的事实基本属实,不构成侵权。
2、知产案件
(1)著作权纠纷
①原告中经网数据有限公司诉被告中华网国际网络传讯有限公司侵犯著作权纠纷。法院经审理认为,只要图表所表达的内容能体现制表人员独自的判断则该图表就具有独创性。本案中,正是因为原告带有主观性的差值填补、季节调整才使图表中某些“点&”的位置的安排体现了与其他公司所制作的图表的区别。横纵坐标轴刻度的选择,虽然受制于此类图表的特点,无论何人绘制,曲线走势图的大体走向可能会相似,但是因为坐标轴刻度选择上的主观性,使整个图表的形态会因绘制者不同的判断而呈现出区别。颜色背景的选择,虽与数据无关,但却亦属于绘图者针对其所绘制图表的美感所做的选择。因而本案所争议的曲线走势图图表具有独创性。故而被告在其网页上使用了原告网页上的“中经宏观经济预警信号&”图表10幅,“中经景气动向&”、“中经先行合成指数&”等曲线走势图68幅,构成著作权侵权。
②原告上海汉涛信息咨询有限公司诉被告北京搜狐互联网信息服务有限公司侵犯著作权纠纷案。[9]法院经审理认为,原告大众点评网以及《北京餐馆指南》、《上海餐馆指南》二书所载涉案11家餐馆商户简介中的引号内文字系由原告选摘自网友上传于大众点评网的关于各地餐馆的评论,引号内文字均系简单的日常用语,因并非具有独创性的文字表达而不能成为著作权法所保护之作品,因而原告将该些文字融入到对餐馆的简介中不需要获得用户的许可,原告对涉案餐馆所做的商户简介具有独创性,可以成为著作权法所保护的作品,原告对涉案11家餐馆商户简介享有著作权。
③原告济南白兔信息有限公司诉被告佛山鼎容软件科技有限公司著作权纠纷案。[10]法院经审理认为,原告对国家商标局商标公告中的商标信息内容进行提取、分类和整理,并对商标标志中所含的文字、数字等进行进一步提取和整理,同时还对商标信息后续的变更情况进行汇总,加入自定义的字段信息等。原告对商标数据的编排和整理体现出独创性,涉案数据库构成汇编作品原告对此享有著作权,可受著作权法保护。由于被告数据库中存在多个含有原告暗记的商标标志,在被告不能证明前述数据来源于其他地方的情况下,可以认定被告实施了复制原告数据库多个商标的数据的行为。
(2)不正当竞争纠纷
①原告北京阳光数据公司与被告上海霸才数据信息有限公司技术合同、不正当竞争纠纷一案。[11]法院经审理认为,《SIC实时金融》信息作为一种新型的电子信息产品,应属电子数据库,在本质上是特定金融数据的汇编,这种汇编在数据的编排和选择上并无著作权法所要求的独创性,不构成著作权法意义上的作品,不受著作权法的保护。但原告作为特定金融数据的汇编者,对数据的收集、编排,即对《SIC实时金融》信息电子数据库的开发制作付出了投资,承担了投资风险。该电子数据库的经济价值在于数据信息的即时性,原告正是通过向公众实时传输该电子数据库的全部或部分内容而获取收益,原告对于该电子数据库的投资及由此而产生的正当利益,应当受到法律保护。被告未经原告许可,其行为违反了经营者在市场交易中应当遵循的诚实信用原则和公认的商业道德,损害了原告的合法权益,已构成不正当竞争。
②原告上海汉涛公司诉被告北京爱帮公司不正当竞争案。[12]法院经审理认为,大众点评网的商户简介和用户点评,是原告搜集、整理和运用商业方法吸引用户注册而来。原告为此付出了人力、财力、物力和时间等经营成本,由此产生的利益应受法律保护。对于大众点评网的商户简介和用户点评,虽然被告爱帮网注有“在大众点评发表”字样和链接标识,但爱帮网已对全部商户简介内容和绝大部分点评内容进行了充分展示,网络用户一般不会再选择点击大众点评链接标识。因此,爱帮网的商户简介和用户点评已经构成对大众点评网相应内容的实质性替代,必将不合理的损害汉涛公司的商业利益。被告的这一经营模式违反公平原则和诚实信用原则,违反公认的商业道德,构成不正当竞争。
③原告北京集奥聚合科技有限公司诉被告刘国清、北京青稞厚成科技有限公司不正当竞争纠纷案。[13]法院经审理认为,大数据系互联网技术高速发展的产物,表现为通过网络技术无差异地收集网络用户上网信息,根据需要对数据进行整理、挖掘和分析,形成一定的数据库,用以投放广告或者其他用途。原告与青稞公司均从事大数据服务,向客户提供精准广告服务,二者间具有竞争关系,刘国清将其技术资历作为公司的业绩向投资人进行广告宣传,故刘国清的行为显然违背了其对原告应负的竞业禁止义务,损害了原告的权益。青稞公司在知晓刘国清的竞业禁止义务情况下,接受刘国清出资并聘任其担任公司的首席技术官,从事与原告相同业务,该行为违反了公认的商业道德及诚实信用原则,损害了原告的合法权益,应承担赔偿责任。
④原告北京淘友天下技术有限公司等与被告北京微梦创科网络技术有限公司不正当竞争纠纷案。[14]法院经审理认为,淘友技术公司、淘友科技公司并没有基于《开发者协议》在取得用户同意的情况下读取非脉脉用户的新浪微博信息,其获取前述信息的行为没有充分尊重《开发者协议》的内容,未能尊重用户的知情权及自由选择权,一定程度上破坏了OpenAPI合作开发模式,违背了在OpenAPI开发合作模式中,第三方通过OpenAPI获取用户信息时应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则,违反了诚实信用原则和互联网中的商业道德;同时淘友技术公司、淘友科技公司未经新浪微博用户的同意及新浪微博的授权,获取、使用脉脉用户手机通讯录中非脉脉用户联系人与新浪微博用户对应关系的行为,违反了诚实信用原则及公认的商业道德,破坏了OpenAPI的运行规则,构成不正当竞争行为。
⑤原告上海钢联电子商务股份有限公司与被告上海纵横今日钢铁电子商务有限公司不正当竞争纠纷案。[15]法院经审理认为,原告通过组建资讯团队形成的钢铁行业内完整的钢材、特钢、炉料等各项数据库的数据信息系原告付出大量劳动所获得,该数据信息能够为原告带来利益,体现了原告的竞争优势,故原告对其数据信息享有合法权益。两被告关于原告的数据信息是市场公开的信息,不具有独创性的抗辩意见缺乏事实和法律依据,不予采信。
⑥原告衢州万联网络技术有限公司诉被告周慧民等侵害商业秘密纠纷案。[16]法院经审理认为,原告主张保护的“BOX网络游戏社区”网站数据库中的用户信息,能为原告带来经济利益且具有实用性,且该50多万个注册用户名、注册密码和注册时间等信息不易为相关领域人员普遍知悉和容易获得,且原告对上述信息采取了保密措施,故上述信息符合商业秘密的构成要件,是原告拥有的商业秘密,依法应受法律保护。
(3)技术服务合同纠纷
原告上证所信息网络有限公司与被告新华富时指数有限公司合同纠纷案。[17]法院经审理认为,被告未经原告许可与新加坡交易所共同开发上市了中国A50指数期货,在此过程中被告虽未将上海证券交易所实时股票行情直接提供给他人使用,但中国A50指数期货的基础即是其编制的中国A50指数,其成份股包含了在上海证券交易所上市的38种股票,被告根据这些实时股票行情和深圳证券交易所的12种实时股票行情编制了动态的、即时的中国A50指数,故被告开发、上市中国A50指数期货的行为,实质就是利用原告按约提供的上证所实时股票行情开发了衍生产品,该种行为显属违反合同约定。
表一:涉大数据案件的类型分布图[18]
上述案件涉及到民事和知识产权领域,我们之所以将民事案件纳入到案例中,是因为这类案件对我们研究大数据企业的商业模式存在重要作用,有助于理清行业存在的一些问题。大数据目前仍属于一种新兴事物,IBM对大数据给出了4V特征即:大数据量(Volume)、快速变化(Velocity)、内容庞杂(Variety)和(不)精确性(Veracity)。也正因为大数据拥有的该些属性,导致大数据作为一个事物目前在我国法上找不到对应的权利类型。大数据从其产生、收集到整合、利用,各个阶段都有可能产生法律纠纷。目前司法实践中涉及到大数据的案例除却隐私权、名誉权等民事案件外,知产领域主要是著作权、不正当竞争、技术服务合同领域。
大数据的基本处理流程包括采集、存储、分析和结果呈现等环节。采集到的数据对存在语义模糊、数据缺失等问题而无法直接使用,所以该环节还应包括数据的预处理。[19]存储数据的同时亦进行着数据管理,经分析和处理所得数据成果需通过应用而发挥其最终价值。因此,可以将数据的处理流程大概划分为数据采集与预处理、数据存储和管理、数据处理与分析、数据成果呈现与应用四个阶段。[20]在当下现实语境下谈及大数据并非仅是数据本身,而是指数据和大数据技术的综合。
在现有知识产权法律法规框架内,可以通过著作权法、专利法以及反不正当竞争法对大数据及其成果进行保护。根据数据处理流程和阶段的不同,对数据以及数据成果的保护路径又各有所偏重。
1、数据采集与预处理阶段的保护
该阶段涉及数据的取得、汇总以及初步的筛选工作,该阶段中采集到的数据内容大多可以通过著作权法予以保护,但是其中包含的一些来源于客观的信息或是用户的网络留痕数据不符合著作权法所要求的独创性要件,因难以通过著作权法进行保护。
该阶段数据中的以文字、图片和视频等形态呈现的内容可以通过著作权法予以保护。司法实践中较为常见的有以下三类:第一类,软硬件服务商自行收集、整理后上传至自有平台的数据,比如某门户网站房产频道中关于某楼盘的介绍性文字和图片;[21]第二类,网络媒体自行或委托创作以及经授权可以使用的资讯类内容,比如新闻资讯类网站中资讯新闻;第三类,网络用户自行制作和提供的内容,比如社交平台中用户发布的文字、图片以及视频、电商网站中的用户评价、旅游网站中旅友的游记。[22]受著作权保护的前提条件是具有一定的独创性能够构成著作权法意义上的作品。在这三类数据内容具有一定的独创性能够构成著作权法意义上的作品的情况下,即可以通过著作权法予以保护。
在司法实践中,第二类的资讯类内容通过著作权法进行保护的难度不大,但是第一类和第三类数据类型想要通过著作权法进行保护,不仅要满足构成作品的前提条件,还需要确认其权利归属情况。尤其是在第三种数据类型中,数据内容的产生基于用户自行制作和提供,平台商对该部分数据享有何种权利或者权益,在数据赋权仍未在法律层面进行确认的情况下,平台商以何种身份维权、主张对该种数据内容享有何种权利,仍是司法实务中的一个难点问题。从另一方面而言,采集数据同样不能侵犯他人的权利,不仅包括不侵犯他人的著作权,同样包括不侵犯他人的商业秘密以及不违反网络爬虫类“君子协定”。其中商业秘密以及“君子协定”所涉及的诚实信用以及商业道德原则将在下文加以详细阐述。
2、数据存储和管理阶段的保护
对于收集来的海量的结构化和非结构化数据,需要运用手段和技术对其进行存储和管理,在该阶段中多涉及数据的集合和汇总,比如数据库、数据仓库、云数据库等。[23]该部分内容也可以通过著作权法予以保护。
《伯尔尼公约》明确将数据信息作为汇编作品予以保护,《与贸易有关的知识产权协议》第10条第2款规定:“数据或者其他材料的汇编,无论采用机器可读形式还是其他形式,只要其内容的选择或安排构成智力创作,就应该给予保护。”我国《著作权法》第十四条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”在数据的存储和管理阶段中形成的数据库如果在内容的选择或者编排上体现出了一定的独创性,即可以将该数据库作为汇编作品通过著作权法予以保护。前述济南白兔信息有限公司诉佛山鼎容软件科技有限公司著作权纠纷案法院即认定了原告对商标数据的编排构成汇编作品。
大数据要在著作权法上获得保护,首先需要满足独创性的要求,但现实中多数数据来源于客观事实,数据的收集也多来自公开领域,基于某些用户的使用习惯或是行业惯例,收集到的数据信息可能无法给予数据采集者太多的个人创作空间,对于那些缺乏独创性的数据集合则无法通过著作权给予保护。由此,如何界定某一数据集合是否具有一定的独创性也成为通过著作权对其进行保护的一个难点。需要着重指出的是,著作权保护的是数据的选择或编排方法,而非数据选择或编排的内容,对于大数据而言他人可轻易改变编排方法,但实质性内容可能一致,该种情况下对于大数据本身的保护也是一个难题。
3、数据处理与分析阶段的保护
对庞大数据集合进行处理和分析从而得到具有应用价值的数据或者数据产品。在此阶段数据的价值得到了巨大程度的提升,具有商业价值的数据可以通过商业秘密予以保护,为分析处理数据所使用的方法可以通过方法专利予以保护。
通过数据处理和分析获得的数据成果一般都具有相当的经济价值,由此该类数据成果的实用性要件不难满足,在司法实践中该类数据成果的秘密性和保密性是论证其构成商业秘密的难点。前述北京阳光数据公司与上海霸才数据信息有限公司技术合同、不正当竞争纠纷案中法院认定原告阳光公司的《SIC实时金融》数据分析格式符合商业秘密的构成要件。本案中涉及了两种常见的与数据资产相关的商业模式——租售数据模式与租售信息模式。租售数据模式是指售卖或者出租广泛收集、精心过滤、时效性强的数据。[24]。而信息与数据不同,是指经过加工处理,承载一定行业特征数据集合。[25]