在自然科学、社会科学领域,开放数据的概念逐渐成为主流,即自由地共享数据将带来巨大好处。不过想要让数据开放真正落到实处,我们还有很长的路要走。
过去五年间,像盖茨基金会(Bill & Melinda Gates Foundation)、惠康基金会(the Wellcome Trust)、美国国立卫生研究院(NIH)以及美国国家航空航天局(NASA)等私人和公共研究机构均制定了数据共享方面的政策。美国的市、州和国家级政府也一直在推动数据开放。一些学术出版商以及学术期刊甚至把数据开放作为必选项。
但推动数据开放的工作目前陷入了停滞状态。
根据Figshare在2017年发布的《开放数据状况》报告,2300名接受调研的科研人员中有60%声称自己“经常或有时”(either frequently or sometimes)共享数据,而选择“经常”(frequently)的仅有20-30%。另一项针对1200名科研人员的调研则显示,选择在数据库中共享数据的不足15%。
这意味着目前所施行的开放数据政策的效果不及预期。换句话说,政策制定者想当然地认为,政策出台之后,人们就一定会遵照执行。
想要真正实现数据开放,科研人员首先应该打心底拥护这一概念,其次还要有正确的激励措施。
调查还显示,科研人员对共享数据犹豫不决的另一原因在于,他们担忧自己的研究成果被误读或误用,甚至窃取。此外,学术界在寻求资金资助上竞争激烈,“拥有”(owning)数据要比分享更能令个人获益。
为此,
我们应该把数据共享的话题核心从 “失去”转为“获得”。
科研人员的声誉就是一个很好的开始。好消息是那些科研人员在上面发布数据集的数据期刊正越来越受欢迎。《数据简介》(Data in Brief)、《生物多样性数据期刊》(Biodiversity Data Journal)、《科学数据》(Science Data)这三大期刊的被引用次数从2012年的3次跃升至2016年的1028次。
另一种激励方式是尽可能提高科研人员和资助者的投资回报率。
个人研究者目前很难从分散的数据库中搜集、整理数据,并以此撰写能够发表在较有影响力学术期刊上的文章。资助者也很可能把资金浪费在其他人已经做过的相似项目上。但数据共享可以解决上述问题。通过数据共享,一些跨学科的突破性发现更有机会显现出来。资助者通常偏爱这些创新研究,这反过来也为科研人员解决了缺乏资金的难题。
为了评估某一项目,我和同事之前在津巴布韦搜集了近2500名当地青少年的数据。不过由于缺乏资金,我们面临着研究人员常常遇到的问题,即无法对数据进行更深入的分析。为此,我们选择在期刊上公布了约10%的数据,希望能够吸引更多的合作者。
但想要充分发挥数据共享的潜力,资助者还应当转变思维方式,加强对数据质量的监督及管理,并为数据库的后续分析提供必要的支持。此外,资助者要给予科研人员充分的时间,以便他们挖掘出数据背后更多的故事。
除了为科研人员和资助者提供更有效的激励措施之外,科学技术的进一步发展还需要文化氛围发生转变。
以下计划提供了很好的范例。比如开放科学中心(the Center for Open Science)在积极推进学术研究的开放性、完整性,以及可复制性。美国加州伯克利大学的“社会科学透明度倡议”(the Berkeley Initiative for Transparency in the Social Science)在公开数据之外,还提供相关培训,以弥补政策研究中的疏漏。科克伦奖励基金会(the Cochrane-REWARD Prize)则在研究如何更高效地使用研究经费。据估算,全球每年浪费掉的科研经费约为1700亿美元。
上述举措解决了数据开放所面临的部分障碍,但想要让科研人员成为其中的主要推动力量,我们依然有许多工作要做。我们相信,数据开放有助于研究透明度的提升,以及创新方案的提出,而这一切会深刻影响全球约12亿青少年的未来。随着数据开放普及程度的提高,由此触发的共享与合作也会越来越多,随之而来的好处也将得以延伸。
(
如有侵权