专栏名称: 生信媛

生信媛，从1人分享，到8人同行。坚持分享生信入门方法与课程，持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。

NODE高通量数据库基础介绍及其页面规律

生信媛 · 公众号 · 生物 · 2021-01-27 10:01

正文

后起之秀奔涌而至，欢迎大家在《生信技能树》的舞台分享自己的心得体会！

上面是新晋小编“十年”的团队的稿件

前面我们分享了中国测序数据另外一个中心CNGBdb 以及 中科院北京基因组研究所生命与健康大数据中心 开发的原始组学数据归档库GSA (Genome Sequence Archive)：不止是NCBI的SRA可以下载测序数据，下面让我们一起看看另外一个国产数据库吧！

National Omics Data Encyclopedia，NODE，国家组学数据百科全书（也太霸气了），是由中科院上海营养与健康研究所及中科院计算生物所PICB 建立的，致力于：

1）全方位的大数据服务，存储、分析、处理和分析；2）建立生物医学数据资源应用的技术架构；3）加速大数据在生物医学应用的进程。

数据库链接：https://www.biosino.org/node/

目前和NCBI 的SRA 数据库，中国的CBCB 等一样，也存储了很多的序列数据。

如之前上海单位疫情中在nature 上发表的这篇文章，就将结果也共享在了node 上：

令人惊讶的是， 我直接用商业邮箱（foxmail）就注册成功了：

ps：因为它说我的学生邮箱不合法，哈哈哈

甚至还会可视化你的访问记录，有点酷：

可以直接通过搜索文章中的OEP 编号获取，比如OEP000155：

https://www.biosino.org/node/search

如果显示public 则可以直接访问。

可以直接点击里面的数据进行访问：

也可以下载它们：

甚至还提供了作者的分析的数据，比如突变和拷贝数数据，以及表达矩阵：