专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
51好读  ›  专栏  ›  生信媛

数据上传何必舍近求远,试试GSA吧

生信媛  · 公众号  · 生物  · 2018-05-22 07:00

正文

请到「今天看啥」查看全文


在昨天的推送里 高通量数据如何上传到GEO? ,有一些小伙伴上传大量数据到GEO时会遇到神奇的网络问题。在国内,解决这个问题除了死磕GEO数据库外,还有一个比较好的解决方案,就是 GSA

那么问题来了,什么是GSA?

年初的时候,我写了一篇文章介绍目前主流的数据库, 每日文献:生物数据中心的年报 ,其中一不小心把BIG的缩写写错了。也因此通过这个机会了解到了一个我们自己的数据库GSA(Genome Sequence Archive, GSA)。在5月份的NGS创新者大会上,也听到了他们关于GSA数据库的宣传,其中一个 万狗数据库( http://bigd.big.ac.cn/dogsd ) 成功的吸引了我的注意力,当然他们还有其他特色的数据库。

考虑到还是有很多人不知道 GSA 数据库的存在呀,所以稍微宣传下GSA,希望生信媛的小伙伴给他们来一波强势的压力测试。

BUT,这篇文章不会详细介绍具体的上传流程,因为目前已经有两篇推送介绍GSA的使用方法,这里就不重复介绍用法了。

如果看了之后还是不明白,还是遇到了问题,也可以加入他们的qq群 548170081 通过中文进行交流哦。

如果数据量太大,直接 寄硬盘 都行,毕竟在国内,想怎么来都行。

你可能会担心上传到 GSA ,国外杂志不接受GSA提供的accession,怎么办?

目前,包括Cell、Nature、PNAS、Genome Research、Cell Stem Cell、Genome Biology、Plant Cell等高影响力期刊在内的大多数国际期刊都认可GSA

并且近年来数据量增长也是非常可观,可以说是挺优秀的啦。


最后,建议大家在上传高通量数据的时候可以优先考虑下GSA, 在国内,应该不会比上传到GEO更麻烦了。

更多有关该数据库的知识可以阅读原文,点击Chinese就可以看中文版的最新帮助文档了。

也希望自己能够早日发文章,用到这个数据库,到时候我再写一篇自己的实际操作。。







请到「今天看啥」查看全文