全球开放数据运动始于美国。2009年1月,美国总统奥巴马签署了《开放透明政府备忘录》,要求建立更加开放透明、参与、合作的政府,体现了美国政府对开放数据的重视。同年,数据门户网站Data.gov上线。
2011年9月20日,巴西、墨西哥、美国等八个国家联合签署《开放数据声明》,成立开放政府合作伙伴(OGP,Open Government Partnership)。截至2014年2月10日,全球已有63个国家加入开放政府(数据)合作伙伴。
2015年9月,国务院印发《促进大数据发展行动纲要》,提出要加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放。
相比之下,中国的政府数据开放步伐缓慢得多。
观数智库创始人、大数据专家涂子沛在《大数据》一书中指出,开放数据指的是将原始数据及相关元数据以可以下载的电子格式让第三方自由使用。开放数据不仅意味着公开数据,更要让数据可以重复使用、自由加工。
根据英国开放知识基金会(Open Knowledge Foundation)的定义,开放需具备3项基本元素:非歧视性、机器可读性和开放授权性。所谓“机器可读性”,是指开放的数据应该能让机器读懂,如对于表格数据应该采用.csv。
【图例:数说南海提供5种数据格式】
机器可读,数据才能通过算法进行分析,才能实现数据的价值。因此,如果某地政府开放的数据是PDF格式,那就属于“装姿势”了。
“三公”详细地列出了公车、公款吃喝、因公出国支出的数据,经济和社会发展统计公报囊括了GDP增速、居民人均可支配收入等大大小小的数据。因此,很多人误认为这些就是数据开放。
但是,事实并非如此。
涂子沛在《数据之巅》中写道,数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。
【传统意义上的数据和信息的差别】
因此,上述的“三公”公开数据、经济和社会发展统计公报,属于在原始数据基础上进行加工、分析、归纳后得出的结果,并不属于数据公开的范畴。
复旦大学数字与移动治理实验室主任郑磊指出,传统的政府信息公开,公开的是经过加工和分析的信息,甚至只是一些文件。他认为,放数据要求开放到底层的、原始的数据。
当前,我国政府部门组织架构上的条块分割和各自为政,使数据分散在各部门,形成了一个个数据烟囱或数据孤岛,阻碍了数据的开放和利用。
一方面,政府部门往往把数据资源看成是本部门的权力资源,“你的就是你的,我的就是我的”,部门间的数据共享都难实现,更谈不上对社会的开放;另一方面,各部门的数据获取途径、筛选标准不同,一些数据还是纸质记录,数据质量参差不齐,加剧了开放的难度。
就以常见的纸质档案为例,由于不同地域的档案信息不开放、未联通,当一位公民需要办理异地档案存续时,他可能遭遇办事难,接受函、调档函、盖章签字,手续繁杂。
这些档案的规模十分庞大,一边是档案调进调出费时费力,一面是纸质档案占地儿,频繁查阅转移易丢失、损毁。可见,为了优化办事流程,提高效率,将档案数据化并实现异地开放共享、消除数据烟囱迫在眉睫。
公民的社保缴费记录,患者的就诊记录,企业的工商登记信息……这些数据的产权是个人或企业,还是属于政府部门?如何做出清晰界定,将直接决定谁享有数据的权益。
研究者认为,当前关于数据的产权归属问题还远未达成共识,特别是在去除个人身份属性的数据交易中,到底是数据主体(产生数据的个人)还是记录数据的企业拥有数据的所有权,各方莫衷一是。
2010年,发改委批复公安部所属的全国公民身份证号码查询服务中心对外提供公民信息比对服务,提供“一致”或“不一致”信息,可收取公民身份认证服务费,收费标准为:比对内容五项以下(含五项),每次5元;比对内容五项以上,每次10元。
公民信息作为政府数据的一部分,这种收费受到质疑。
中国社会科学院法学研究所副研究员支振锋撰文指出,这个拥有13亿人口身份数据的“全国公民身份信息系统”是真正的“全民所有”,谁能够开发和利用这些信息获利是个问题。此外,数据库开发、建设的几千万投资来自公共财政,数据收集、整理、报送属于政府履行公权,数据库的经营服务性收费也是问题。
大数据时代,传统的隐私保护路径已经失效,如何兼顾隐私保护,是政府数据开放时不可回避的问题。
在隐私保护方面,曾有人提出了全生命周期的概念。持有这种观念的英美国家认为,应该在政府数据开始产生的每个流程,都加入隐私分析和设计,而不是在最后环节才考虑。
此外,美国规定,各部门应对照现有法律规定和部门高级隐私专员一起,决定数据的公开是否恰当,并需向法律部门咨询协商最后确定;英国则在推进数据开放的主要部门任命专门的隐私保护专家。
我国尚未出台全国性的数据隐私保护法规,而在全国首部地方大数据法规《贵州省大数据发展应用促进条例》则规定:“数据共享开放,应当维护国家安全和社会公共利益,保守国家、商业秘密,保护个人隐私,保护数据权益人的合法权益。”
参考资料:
1. 《大数据》,涂子沛,广西师范大学出版社出版;
2. 《数据之巅》,涂子沛,中信出版社出版;
3.《开放数据:概念、现状与机遇》,高丰,《大数据》杂志(2015.2);
4.《大数据时代中国政府数据公开面临的阻碍与对策研究》,黄思棉、秦凤微,《法制与社会》杂志(2015.4)