专栏名称: 投基大时代
极客精神×TMT视界
目录
相关文章推荐
51好读  ›  专栏  ›  投基大时代

1.6亿条纽约打车大数据随便下载 PK 8000条上海厕所信息无法下载,这就是开放数据的差距

投基大时代  · 公众号  ·  · 2017-12-06 21:30

正文

「上海一共有多少个公共厕所,每个区县各有多少个?」,作为一个大数据爱好者,我本以为这是一个回答起来易如反掌的问题。但是真正操作时才发现,要从官方渠道,了解关于上海公共厕所的权威信息,竟然是一件极为困难的事情。

无法轻易拿到的公厕信息

是的,平时有搜集各种大数据的癖好,所以在看到关于上海公共厕所的问题时,第一时间想到的就是「上海市政府数据服务网」,作为上海政务开放数据的门户,上面有大量各个政府部门开放的数据,从上面拿到公厕名录,在我想来是极其轻松的一件事情。

很可惜,我只猜对了前半部分。的确,在上海市政府数据服务网上,是有上海所有的公厕的数据。

但是!我遗憾的发现, 上海公厕信息被归类为「特定公开」,而不是常见的「普遍开放」类别 ,这意味着——如果你是个人用户,在下载这份数据之前,必须进行实名认证。而完成实名认证的唯一手段,是用「市民云」账户来认证。本以为作为上海市民早就完成「市民云」认证的我完成这道手续,是很简单的事情。

但遗憾的是,连续几天尝试用市民云,都无法完成实名认证。这意味着,我无法从上海市政府数据服务网这个权威出口,获得上海的所有公厕名录。

我不太明白,公厕的信息有多重要,重要到不能和绝大多数政府信息一样采用「普遍开放」的管理,而是要被归类在「特定开放」,只有特定人等完成特定认证后才能下载。

细看了《上海市政务数据资源共享和开放2017年度工作计划》中整整236项重点开放领域的清单后我发现,这其中除了少数是「依申请开放」类别外,其余全数是「普遍开放」,并无「特定开放」这个类别。这让我相信,公厕信息被归类为「特定开放」必须实名认证下载,也许只是数据上传分类中的一个小差错,而非刻意的保密需求。

虽然可以谅解这样的小差错,但是必须说这依然让我作为数据使用者,有些遗憾。因为这其实并非个别问题,而是整个政府开放数据进程中一系列问题的缩影。

所谓一叶知秋,「公厕信息」的确是代表。

上海开放数据第一,但仍不够好

这些年,全球都在掀起政府开放数据的浪潮,我国也在力推。2016年的《促进大数据发展行动纲要》首次在国家层面推出了「公共数据资源开放」的概念,并强调:

大数据成为提升政府治理能力的新途径 。大数据应用能够揭示传统技术方式难以展现的关联关系,推动政府数据开放共享,促进社会事业数据融合和资源整合,将极大提升政府整体数据分析能力,为有效处理复杂社会问题提供新的手段。建立「用数据说话、用数据决策、用数据管理、用数据创新」的管理机制,实现基于数据的科学决策,将推动政府管理理念和社会治理模式进步,加快建设与社会主义市场经济体制和中国特色社会主义事业发展相适应的法治政府、创新政府、廉洁政府和服务型政府,逐步实现政府治理能力现代化。

就开放数据而言,上海早在2011年就率先开展了政府数据开放的可行性研究,并拟定了政府数据开放试点计划,并于次年推出了全国首个开放数据门户——上海市政府数据服务网。

而从开放数据来看,上海相比其他跟进的政府,也是表现优异。2017年5月,由复旦大学、提升政府治理能力大数据应用技术国家工程实验室联合发布的《中国地方政府数据开放平台报告》,在全国19个地方政府开放数据平台中, 上海以数据集数量、开放授权协议、元数据覆盖率等方面评估来看,位居第一 ,不但高于近些年以大数据闻名的贵阳,也高于坐拥阿里巴巴的浙江和坐拥腾讯的深圳。

但是,作为上海开放数据的实际使用者,我依然有太多太多的小细节可以吐槽。

比如这次偶遇的 必须认证 才能下载的公共厕所信息。

比如 形同虚设问题 ,以交通委公布的驾培人员基本信息为例,数据库里面除了人员名字以外什么信息都没有,除了用作姓名学研究几乎没有第二个用处,可谓是未公布而公布。

比如 核心字段无数据







请到「今天看啥」查看全文