国家基因库已储存了包括植物资源在内的样本超过1500万份,并建设了年产数据5Pb以上、可支撑数字化农业项目的数字化平台。目前,国家基因库已构建了四十多个数据库,总访问量达1.18亿次。其中,onekp4blast数据库基于千种植物项目(1KP,国际多学科联盟项目,对超过1000种植物进行了大规模测序研究)数据构建了在线Blast平台,提供在线Blast服务。截止到2017年6月21日,注册用户数947,已完成Blast任务量74726个;谷子数据库是基于深圳华大基因研究院和张家口市农业科学院等单位谷子基因组研究项目数据设计,创新的将谷子的表型和基因型贯穿起来,通过谷子的表型信息可以查询和检索谷子的基因型信息,通过基因型可以查到对应的表型信息。同时,谷子数据库基于生物大数据技术,利用数据库中的基因型和表型数据,使用机器学习方法建立模型,最终实现从品种的基因型来预测品种表型,助力智能分子育种。
onekp4blast :
https://db.cngb.org/blast4onekp/
谷子数据库:
https://db.cngb.org/millet/
其他数据库请点击:
https://db.cngb.org/dc/home/
此外,国家基因库活体库致力于打造成为中国诺亚方舟,以保护和保存世界三十多万种植物、百万种动物、近千种微生物活体资源为目标。同时,建立种子资源库、植物园来保存和保护植物种子样本和活体资源,并与数字化平台、合成与编辑平台等联动,促进资源数字化和多组学研究,推动重要种质资源数字化和全球共享,实践创新型应用。目前,国家基因库活体库已开展全球第一个环境生态系统全面数字化和深入组学研究——瑞丽植物园数字化项目。