专栏名称: 生信媛

生信媛，从1人分享，到8人同行。坚持分享生信入门方法与课程，持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。

多物种批量下载KEGG数据并做成KEGG.db包

生信媛 · 公众号 · 生物 · 2019-12-18 12:05

正文

请到「今天看啥」查看全文

上次跟Y叔联手推出createKEGGdb后，反响热烈，感谢大家的支持。但是上次的包只能下载一个物种，能不能批量下载我们所需的多个物种，甚至将所有的物种都下下来呢？

必须可以！

首先安装createKEGGdb包：

remotes::install_github("YuLab-SMU/createKEGGdb")
# remotes::install_github("zrchen/createKEGGdb")

指定需要下载的多个物种：比如拟南芥（"ath"）和人（"hsa"）（具体物种和缩写的对应关系可以查看KEGG的API：http://rest.kegg.jp/list/organism）。

library(createKEGGdb)
species "ath","hsa")
create_kegg_db(species)

测试一下刚刚生成的KEGG.db包：

install.packages("./KEGG.db_1.0.tar.gz", repos=NULL)
library(KEGG.db)
library(clusterProfiler)

data(geneList, package="DOSE")
gene  2]

kk                  organism     = 'hsa',
                 pvalueCutoff = 0.05,
                 qvalueCutoff = 0.05,
                 use_internal_data =T)
nrow(kk)
head(kk)

得到的结果跟上一篇推送《KEGG数据本地化，再也不用担心网络问题了》是一样的。

如果想下载KEGG上 所有物种 的做富集分析所需的信息怎么办？

create_kegg_db("all") # 即可

最后补充一点：有一些物种信息，虽然KEGG的物种列表（http://rest.kegg.jp/list/organism）里有，但是对应的pathway相关信息其实是没有的，这种情况程序会自动跳过。另外，网络或者服务器问题，以至于数据没下载下来，也会出现同样情况。

多物种批量下载KEGG数据并做成KEGG.db包

正文

请到「今天看啥」查看全文

看完你还想看

请到「今天看啥」查看全文