专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
51好读  ›  专栏  ›  生信媛

NODE高通量数据库基础介绍及其页面规律

生信媛  · 公众号  · 生物  · 2021-01-27 10:01

正文


后起之秀奔涌而至,欢迎大家在《生信技能树》的舞台分享自己的心得体会!

上面是新晋小编“十年”的团队的稿件
前面我们分享了 中国测序数据另外一个中心CNGBdb 以及 中科院北京基因组研究所生命与健康大数据中心 开发的原始组学数据归档库GSA (Genome Sequence Archive): 不止是NCBI的SRA可以下载测序数据 ,下面让我们一起看看另外一个国产数据库吧!

1. 简介

National Omics Data Encyclopedia,NODE,国家组学数据百科全书(也太霸气了),是由中科院上海营养与健康研究所及中科院计算生物所PICB 建立的,致力于:

1)全方位的大数据服务,存储、分析、处理和分析;2)建立生物医学数据资源应用的技术架构;3)加速大数据在生物医学应用的进程。

数据库链接:https://www.biosino.org/node/


目前和NCBI 的SRA 数据库,中国的CBCB 等一样,也存储了很多的序列数据。


如之前上海单位疫情中在nature 上发表的这篇文章,就将结果也共享在了node 上:


2. 注册

令人惊讶的是, 我直接用商业邮箱(foxmail)就注册成功了:

ps:因为它说我的学生邮箱不合法,哈哈哈



甚至还会可视化你的访问记录,有点酷:


3. 高通量数据获取

可以直接通过搜索文章中的OEP 编号获取,比如OEP000155:

https://www.biosino.org/node/search

如果显示public 则可以直接访问。


可以直接点击里面的数据进行访问:


也可以下载它们:


甚至还提供了作者的分析的数据,比如突变和拷贝数数据,以及表达矩阵:







请到「今天看啥」查看全文