2017年10月25日,
深圳国家基因库重磅发布了国家基因库核酸序列归档系统(CNGB Nucleotide Sequence Archive , CNSA)
。
国家基因库核酸序列归档系统(CNSA)
是一个方便、快捷地在线提交生物研究项目、样本、实验等信息数据的系统
,致力于生物测序信息和数据的存储、共享,旨在为全球的研究者提供当前最全面的数据和信息资源,提高研究者访问和使用数据的便捷性和深入性。
国家基因库核酸序列归档系统(CNSA)宣传片
据悉,历时13年完成的人类基因组计划,促进了基因组学技术的开发,带来了生物、计算、化学等学科的创新发展,其使人们从分子层面理解生命成为可能,也带来了大数据的挑战。
美国国家生物技术信息中心(NCBI)、欧洲生物信息研究所(EBI)、日本DNA数据库(DDBJ)这三个世界级数据中心汇集了全球众多科研工作者的生物学研究数据,尤其是跟序列相关的核酸信息数据。而如今,基因已经成为一种战略资源,关系到国家的根本利益和生物安全,谁掌握这些资源,谁就将站在全球生物产业链的顶端。
深圳国家基因库是服务于国家战略的国家级公益性创新科研及产业基础设施建设项目,以对海量生物资源的存、读、写能力为基础,搭建起基因资源挖掘的公益性、开放性、支撑性、引领性服务平台,真正实现基因资源的共有、共为、共享。基于此理念,
深圳国家基因库建立了国家基因库核酸序列归档系统(CNSA)
。
亮点一:结合国际权威的数据结构标准、满足科研成果的全球共享
结合国际核酸序列数据库(International Nucleotide Sequence Database Collaboration,INSDC)和DataCite标准,CNSA同时接受原始序列和其他支撑数据的递交和归档,实现数据全生命周期——从产生、递交、同步、查询到下载等过程的完整归档,以确保科研成果的完整性。
亮点二:遵循文章发表前的国际数据开放协议,支撑全球科研文章的发表
CNSA遵循Fort Lauderdale Agreement, NHGRIRapid Data Release Policies, Joint Data Archiving Policy, CC0-No RightsReserved等国际数据开放原则和协议,接受来自全球科研的测序研究数据(包括原始数据和其他支撑数据)递交,其数据递交服务可作为文献出版流程的补充,支持早期数据的共享。
CNSA遵循用户所在国家的《人类遗传资源管理暂行办法》和伦理规范,对用户提交的数据和信息,进行伦理批件和人类遗传资源出入境批件的审编和备份。
CNSA结合不同的数据类别和处理方式,采用相应的技术和管理措施,确保数据处于对等的安全级别保护。
CNSA采用高性能的分布式对象存储进行数据归档,结合独立的高可用备份存储系统,实现数据的安全存储。