虽然数据新闻是当前媒体新闻创新的排头兵,越来越多的媒体开始尝试和投入。然而,中国的数据新闻依然非常不成熟,也缺乏行业规范[5]。在当前数据新闻的整个生产过程中,基本的生产三要素,生产者、生产工具和生产对象都存在亟待解决的问题。
(一) 中国数据新闻团队的人员构成较少能够完全符合独立生产数据新闻的需要。
除了影响数据新闻生产效率之外,更为重要的是缺乏数据新闻生产的核心人才——数据分析师。缺少数据分析师意味着缺乏向数据正确提问、深入提问、系统提问的能力。在团队长远发展的层面,数据素养的不足可能带来不能充分认识数据价值,对自身的数据能力建设缺乏长远规划,对已有数据不留存、不积累、不管理。
(二) 虽然市面上已经有数据爬取、数据清洗、数据分析、数据可视化的各种相关工具,但能够熟练使用所有这些工具的数据新闻从业者依然不多。
主要原因是,首先,除了引进数据新闻专业人才之外,更多的媒体需要从业者自我学习或接受技能培训,从而满足数据新闻工作的需要。但目前由一些高校或机构提供的相关培训规模有限,能够辐射的人群不多,培训时间短,内容较为基础。
其次,这些不同的工具中的绝大多数原本是为各自领域的专业用户设计,对数据新闻从业者来说仍有一定的使用门槛。为此,镝次元数据新闻研究中心自主研发了零代码的数据可视化写作系统“镝数”(www.dydata.io),尝试打破数据新闻生产的技术壁垒,提升行业生产效率,已在一些主流媒体得到较好应用。
最后,数据新闻的高要求不免给一些从业者带来了工作的压迫感。
(三) 中国数据新闻从业者面临的普遍难题之一是数据的获取。
首先是数据质量良莠不齐。需要消耗记者大量的时间进行数据的抓取、核查和清洗。
其次,数据获取困难。虽然政府已经提供了公开数据的申请渠道,但根据同业者交流的反馈,能够高效地通过这一渠道获取数据的案例还较少。
其三,与企业或机构的数据合作存在隐患。虽然企业或机构可以提供优质数据,但一般大型数据公司不可能提供原始数据,而会采用根据媒体需求提取数据的方式,媒体对此环节基本不可控。
其四,与个人的数据合作存在的问题在于,一般对于来自权威专家的研究数据,新闻记者较少产生质疑或核查的动机与行动,即便核查,难度和成本也很大。
其五,较多媒体缺乏规范的数据来源注释,导致在媒体反复转引的过程中,数据难以进行追根溯源的核查。
我们排除数据新闻的概念发生衍化的可能性,但如果我们将其本质,即“基于数据科学的知识和技术,通过或结合数据分析,对事实进行新闻报道”,视作一种新闻报道的方法论,那么数据新闻不仅不会很快时过境迁,而且还将在未来的新闻实践的发展中不断向普及化、日常化的方向发展。
斯坦福大学教授杰夫·麦吉(Geoff McGee) 曾在《大数据时代的新闻业》(Journalism in the Age of Data)中指出,数据爆炸使得人们的生活每天都被纷繁浩杂的数据包围,而媒体的职责就在于为读者解析这些数据。
来自《东京新闻》的功松波(Isao Matsunami)在《数据新闻手册》(The Data Journalism Handbook)中提到数据新闻能够为公众提供对于官方资料的独立阐释。来自全球不同地区的研究者、同业者对数据新闻对数据时代信息的解释能力基本达成共识。实际上在西方国家,一些学者和记者已经在数据新闻领域研究、实践了三十多年。
伊利诺伊大学教授Brant Houston认为未来数据新闻将会走向更高级的算法领域,“诸如聚类(clustering)、主题模型(topic modeling)等高级算法,已经被应用到自然语言处理(NLP)技术中了。面对庞大的文本数据集,这些高级算法可以帮我们发现其中的主题或特征。[6]”站在国际化的视野中比较来看,中国数据新闻可以成长的空间远不止未来三十年。对数据的理解、处理和表达能力将会称为数据时代,新闻媒体的基本能力。
注释:
[1] 方洁:《全球视野下的“数据新闻”:理念与实践》,《国际新闻界》2013年第6期。
[2] 喻国民:《从精确新闻到大数据新闻——关于大数据新闻的前世今生》,《青年记者》2014年第36期。
[3] 陈力丹、李熠祺、娜佳:《大数据与新闻报道》,《新闻记者》2015年第2期。
[4] 方洁:《全球视野下的“数据新闻”:理念与实践》,《国际新闻界》2013年第6期。
[5] 方洁:《数据新闻:一个亟待确立专业规范的领域——基于国内五个数据新闻栏目的定量研究》,《国际新闻界》2015年第12期。
[6] ADIEL KAPLAN:报道亚洲 | 数据新闻走向何方?“故事为核,跨界合作”,2016-10-11,
http://cn.gijn.org/2016/10/11/报道亚洲 | 数据新闻走向何方?“故事为核,跨界合作”