这数据共享的理念似曾相识啊,是不是很像生信领域里GEO之类的大型公共数据库?大家研究完了把自己的数据上传,好让别人进行二次开挖。
问题是,临床研究还木有大型公共数据库!可能在今后相当长一段时间内,数据就算共享出来也还是分散的,可能在每篇文章的Supplementary Information里,也可能在其他数据存储机构(比如Dryad、Figshare、作者所属机构提供的云存储库,甚至在别的什么不稳定的网络旮旯里),不便于集中开采。
当然ICMJE也注意到了这个问题,并表示正在开发相关设施,也欢迎群众去他们官网(www.icmje.org)提供方案或意见。所以,预计将来这份规定可能还会更新,比如要求将数据上传到指定或推荐的数据库,或数据格式要满足什么规范等。
其实这是个很好的开始。我们进入大数据时代也有很多年了吧,生信数据共享的实施,比“大数据”一词流行起来还要早,因为单单一个研究课题就能产生很大量的数据,一眼就能注意到它的价值。
但就算如此,它的共享机制到现在也还没有完善,要靠研究者自觉。前不久,有人开发了一个叫Wide-Open的工具,用来检测哪些作者忘了将已发表的GEO、SRA数据进行公开,竟然检测到400多份,有一份还在文章发表后被遗忘了11年才公开,Nature还专门报道了此事。
临床研究数据现在开始共享也还不算晚,它倒是先有比较强势的公开要求,基础设施却落后。不过要借鉴起来应该不难的。可以预见,前沿研究者们马上就会利用这些数据开发出新的研究方法了,我们一边观望,一边跟上吧。
参考资料:
1.Data Sharing Statements for Clinical Trials: A Requirement of the International Committee of Medical Journal Editors
2.http://www.icmje.org/journals-following-the-icmje-recommendations/
3.http://www.icmje.org/recommendations/browse/publishing-and-editorial-issues/clinical-trial-registration.html
4.Text-mining tool seeks out ‘hidden data’