既有的数据库要么不公开或者不能免费获取,要么不适用于学术研究,那么有没有可能建设一个数据库,免费公开并且可以应用于学术研究呢?马季、王群、董超和李华芳最近在Scientific Data发表的The research infrastructure of Chinese foundations, a database for Chinese civil society studies一文,为下一步对中国公民社会和非政府组织的研究的实证研究提供了数据基础。
中国基金会研究基础数据库(Research Infrastructure of Chinese Foundations,简称RICF) 发表在Scientific Data上,是认同并遵循Scientific Data对数据管理和使用的FAIR原则。FAIR是Findable, Accessible, Interoperable, Reusable首字母的缩写,意思是“能找到、易获得、可交互、反复用”。RICF免费公开容易获得,且统一为变量编码,使用各个统计软件通用的格式,正是遵循FAIR原则的一个绝佳示例。
RICF目前收录超过3000家中国基金会的数据,变量主要集中在三个方面:基金会的基本组织信息、项目信息和财务信息。RICF利用计算机技术和志愿者众包,充分挖掘多种数据来源中的有效信息,加以整合。RICF有一个清晰而标准化的数据库底层结构,规范的版本控制,系统化的衡量数据可信度的标准,以及完整详尽的数据字段。RICF或可以为今后类似的数据库工作提供一个样本。
作者马季和王群是美国印第安纳大学的博士候选人,董超任职于CDD科技公司,李华芳是美国伟谷州立大学的助理教授。ⓝ