数据是新的生产要素,支撑数字经济的发展,而公共数据开发还不足,是此次《意见》出台的背景。
2020年,《关于构建更加完善的要素市场化配置体制机制的意见》首次提出将数据作为生产要素,与土地、劳动力、资本、技术并列。根据《数字中国发展报告》的数据,我国2023年数字经济核心产业增加值估计超过12万亿元,占GDP比重10%左右[2],接近了《“十四五”数字经济发展规划》中的目标,即到2025年,数字经济核心产业增加值占国内生产总值比重达到10%[3]。根据中国信通院的统计,2023年,我国数字经济规模达到53.9万亿元,占GDP的比重达到42.8%,较2022年提升1.3个百分点[4]。特别是,人工智能时代,数据的价值更加凸显,高质量数据集是提升人工智能模型水平的一个瓶颈。公共数据的规模体量大、数据质量高,是数字经济的高质量发展的重要支撑。然而,我国公共数据开放还存在“不愿开放、不敢开放、不会开放”难题的问题,要素价值未得到充分释放[5]。
本次意见从三个方面着手,明确共享、开放和授权运营三种开发利用方式,提升公共数据的有效供给。
1)数据共享是在各级政务部门间交换数据,有助于打破“数据孤岛”现象,提升公共服务效率。2)数据开放是面向企业和社会公众,强调公益性。《意见》强调了要“明确公共数据开放的权责和范围”。如我们在《数据或为瓶颈,确权并非关键》里面所强调,公共数据开放的难点在于确定开放的边界。针对公共数据开放标准不一、使用不够便捷的问题,本次《意见》也提出“提高开放数据的完整性、准确性、及时性和机器可读性”。根据《中国地方公共数据开放利用报告(2024)》,截至2024年7月,我国已经有243个省级和城市的地方政府上线了数据开放平台,较2023年新增17个。开放的有效数据集超过了37万个,较2023年提升约2.4万条[6]。3)数据授权运营是将数据授权给运营机构加工成数据产品和服务,再供社会调用。授权运营后的数据既可以有条件无偿使用,也可以根据政府指导定价收费使用。针对数据这种新的生产要素,如何确定其价格是新的课题,因此《意见》提出要“建立符合公共数据要素特性的价格形成机制”。在具体的落实方面,国家数据局已起草完成《公共数据资源登记管理暂行办法》《公共数据资源授权运营实施规范》,形成配套政策。
我们认为,公共数据开发有助于激活“沉睡数据”,壮大数据产业。
根据《全国数据资源调查报告(2023年)》,2023年,我国数据生产总量为32.85泽字节(ZB),同比增长22.44%。2023年,全国数据存储总量为1.73泽字节(ZB),生产总量中2.9%的数据被保存。存储数据中,一年未使用的数据占比约4成[7]。因为大量数据并没有被复用,难以发挥出数据的非竞争特性。我们认为,加快公共数据开发能激活大量“沉睡”数据的价值,扩大我国的数据产业。根据2024年数博会上发布的数据,2023年,全国数据产业规模超过2万亿元[8]。根据《关于促进数据产业高质量发展的指导意见》,到2029年,我国的数据产业规模年均复合增长率超过15%[9],意味着未来五年我国的数据产业规模将翻倍。
建立国家层面的开放平台能进一步助力公共数据开发。
目前,中国的公共数据开放平台以地方主导,还缺少国家层面的数据开放平台。参考国外公共数据的开放经验,我们认为,建立国家层面的公共数据开放平台有助于统一开放标准,使得公共数据能更好地汇集使用。1)美国。1966年,美国通过《信息自由法》,规定美国联邦各机构公布不属于免予公开范围内的信息,其原则是“以公开为原则、不公开为例外”[10]。2009年,美国颁布《开放政府指令》,要求以透明、参与、协同为原则,进一步公开政府数据,使公众了解政府信息[11]。在《开放政府指令》颁布后,2009年Data.gov正式上线,成为美国国家层面的政府数据开放平台。Data.gov的数据量较大,主题丰富,截至2024年10月,共公开了28.2万个数据集,涵盖工业、商业、气候、能源、健康等主题。2)欧盟。2011年,欧盟委员会通过“开放数据战略”以及《公共数据数字公开化决议》,明确了公共数据以“全部公开、例外不公开”为原则,向社会开放[12]。2021年,欧盟整合统一建立了官方政府数据开放平台European data portal,成为欧盟开放数据的单一访问点[13]。截至2024年10月,European data portal涵盖了35个国家的178.8万个数据集[14]。