iSeq是什么?
iSeq是由浙江大学陈铭团队开发,发布于Bioinformatics期刊的一款工具。用一句话概括,iSeq 是一个 Bash 脚本,允许您从 GSA、SRA、ENA 和 DDBJ 数据库下载测序数据和样本信息数据。
资源地址:
github.com/BioOmics/iSeq?tab=readme-ov-file
工具发布期刊:
Haoyu Chao, Zhuojin Li, Dijun Chen, Ming Chen, iSeq: An integrated tool to fetch public sequencing data,
Bioinformatics, 2024;, btae641,
https://doi.org/10.1093/bioinformatics/btae641
[PMID:
39447029
]
下载:
iSeq下载非常便捷,只需一行代码
conda install bioconda::iseq
实操:
①下载原始数据:
首先输入想下载数据集的accession number。如下所示
iseq -i GSE122139(accession number)
目前iseq支持下载的物种数据库包含的accession前缀如下:
Databases
|
BioProject
|
Study
|
BioSample
|
Sample
|
Experiment
|
Run
|
GSA
|
PRJC
|
CRA
|
SAMC
|
\
|
CRX
|
CRR
|
SRA
|
PRJNA
|
SRP
|
SAMN
|
SRS
|
SRX
|
SRR
|
ENA
|
PRJEB
|
ERP
|
SAME
|
ERS
|
ERX
|
ERR
|
DDBJ
|
PRJDB
|
DRP
|
SAMD
|
DRS
|
DRX
|
DRR
|
GEO
|
GSE
|
\
|
GSM
|
\
|
\
|
\
|
下载完成后,iseq会检查文件的md5值,如果md5值与公共数据库提供的md5不一致,则会开启重新下载。如果文件下载并校验成功,则会将文件名存入success.log中,否则,下载失败,文件名将会存入
fail.log中
。
②跳过原始数据下载,只下载样本信息表
iseq -i
GSE122139(accession number)
-m
③所有的参数详情:
总体体验下来,下载速度还是很快的,大家可以去自行感受一下。
更多个性化分析思路和湿实验方案,请扫码合作:
推荐阅读:
最新10+文献|piRNA如何成为冉冉再起的明星分子
很好复现的一篇干湿结合5+/Q1文章|多组学技术破解衰老脊髓的基因密码
2025年如何发一篇10分+的文章
生信分析+实验验证经典范文|10分+肿瘤方向
PyMOL-分子对接结果可视化