专栏名称: i生信
专注生物分析最前沿,定期为大家解读最新高分经典生信文章,为大家提供生信分析思路和套路,方便大家短平快发SCI。
目录
相关文章推荐
51好读  ›  专栏  ›  i生信

生信人狂喜!iSeq:一键下载全网公共数据的神器!

i生信  · 公众号  ·  · 2025-02-19 14:35

正文

请到「今天看啥」查看全文


iSeq是什么?

iSeq是由浙江大学陈铭团队开发,发布于Bioinformatics期刊的一款工具。用一句话概括,iSeq 是一个 Bash 脚本,允许您从 GSA、SRA、ENA 和 DDBJ 数据库下载测序数据和样本信息数据。

资源地址:

github.com/BioOmics/iSeq?tab=readme-ov-file

工具发布期刊:

Haoyu Chao, Zhuojin Li, Dijun Chen, Ming Chen, iSeq: An integrated tool to fetch public sequencing data, Bioinformatics, 2024;, btae641, https://doi.org/10.1093/bioinformatics/btae641 [PMID: 39447029 ]

下载:

iSeq下载非常便捷,只需一行代码

conda install bioconda::iseq

实操:

①下载原始数据:

首先输入想下载数据集的accession number。如下所示


iseq -i GSE122139(accession number)

目前iseq支持下载的物种数据库包含的accession前缀如下:

Databases

BioProject

Study

BioSample

Sample

Experiment

Run

GSA

PRJC

CRA

SAMC

\

CRX

CRR

SRA

PRJNA

SRP

SAMN

SRS

SRX

SRR

ENA

PRJEB

ERP

SAME

ERS

ERX

ERR

DDBJ

PRJDB

DRP

SAMD

DRS

DRX

DRR

GEO

GSE

\

GSM

\

\

\

下载完成后,iseq会检查文件的md5值,如果md5值与公共数据库提供的md5不一致,则会开启重新下载。如果文件下载并校验成功,则会将文件名存入success.log中,否则,下载失败,文件名将会存入 fail.log中

②跳过原始数据下载,只下载样本信息表

iseq -i GSE122139(accession number) -m

③所有的参数详情:

总体体验下来,下载速度还是很快的,大家可以去自行感受一下。

更多个性化分析思路和湿实验方案,请扫码合作:

推荐阅读:

最新10+文献|piRNA如何成为冉冉再起的明星分子

很好复现的一篇干湿结合5+/Q1文章|多组学技术破解衰老脊髓的基因密码

2025年如何发一篇10分+的文章

生信分析+实验验证经典范文|10分+肿瘤方向

PyMOL-分子对接结果可视化







请到「今天看啥」查看全文