专栏名称: 生信百科
依托高校科研平台,面向生物信息科研工作者。生物信息学习资料;常见数据分析技巧、流程;公共数据库分享;科研思路分享;
目录
相关文章推荐
蒲公英Ouryao  ·  玻璃包装,凭什么无法撼动 ·  19 小时前  
蒲公英Ouryao  ·  生物制药1000个常用术语 ·  2 天前  
丁香园  ·  维生素 C + 维生素 B6,竟出大问题 ·  4 天前  
医学影像沙龙  ·  全身各系统常见病MRI诊断... ·  5 天前  
51好读  ›  专栏  ›  生信百科

还用NCBI传SRA数据呢?落伍了!

生信百科  · 公众号  · 医学  · 2017-09-11 10:36

正文

        中国科学院北京基因组研究所生命与健康大数据中心(BIG Data Center, BIGD)于2016年2月29日正式成立,是研究所三大科研体系之一。中心面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据汇交、存储与管理的应用与共享平台,发展组学大数据系统整合、挖掘与分析的新技术、新方法,力争建成支撑我国生命科学发展、国际知名的生命与健康大数据中心。 

来!看一下主页画风(http://bigd.big.ac.cn/):



确实,跟NCBI有相似之处!不过,更好用,中国人还是得支持一下自己的事业!


受基因组所的老同事所托,也是怀有对国人数据库的敬仰之情,本篇文章将对如何传数据进行介绍!



第一步,准备工作


准备好你的reads文件,计算好他们的md5。


比如  

5aa05dd66815b027b10233c8661e07bb    T112_good_1.fq.gz

1c9bd20eae0848fdcaab37cbb3f88cde       T112_good_2.fq.gz


前面的这一串数字就是md5值。


 这个md5呢是对数据完整性的一种校验,百度下载一个md5计算器,就可以进行计算。当然公司测序之后会连带md5一起发给你,这就方便多了。


##第二步,建立bioproject



点击红框位置,进入之后页面:



点击new bioproject,进入页面



继续点击 Creat Bioproject



填好信息,星号位置必填。点击红色按钮,进行下一步




自己建立项目名称,选择是否立即释放,点击红色按钮,进行下一步




选择什么类型数据,基因组、转录组、还是甲基化数据?纯品还是混样?

点击红色按钮,进行下一步:



此步骤可填可不填,点击红色按钮,进行下一步




最后一步是overview阶段,提交确认,这样,bioproject就建立了。



返回返回可以看到,已经成功建立。


构建biosample


先讲一下biosample什么概念,比如我们在四个条件下测的转录组,包括:高盐胁迫、干旱胁迫、低温胁迫、重金属胁迫。

这样的话,我们要建立四个biosample,加入每一个处理下又存在两个重复,这样的话,在每个biosample的experiment下,我们要建立两个run.



点击红框的biosample,进入下一步



点击New Biosample,进入下一步。



点击Creat Biosample,进入下一步



同样的,点击红色按钮



此步骤注意了,要关联bioproject的信息,将上一步构建好的bioproject号码填写进去。点击的时候,会自动进行关联,直接选择就好了。




点击红色按钮,进行下一步。



选择,进行下一步。



这一步信息填的稍多一些,耐心填完,星号为必填。



最终还是,overview。

没问题,提交!



返回,会看到,biosamle里面已经建立了序列号。


同样的,我们建立四个biosample,为了存储四个条件下的数据。这样的话,在biosample菜单下会存在四个序列号。


Reads提交





点击红色框,进入下一步








请到「今天看啥」查看全文

推荐文章
蒲公英Ouryao  ·  玻璃包装,凭什么无法撼动
19 小时前
蒲公英Ouryao  ·  生物制药1000个常用术语
2 天前
医学影像沙龙  ·  全身各系统常见病MRI诊断...
5 天前
全球局势战略纵横  ·  这可能是朴槿惠下台送中国最好的礼物!
8 年前
长鼻君的怀古橱  ·  红白机64合1大回顾:猪小弟 Pooyan
7 年前