专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
生物学霸  ·  重磅,「东方理工大学」公示 ·  3 天前  
BioArt  ·  Protein & Cell观点 | ... ·  5 天前  
华大集团BGI  ·  2024国际衰老与再生研讨会在华大时空中心举行 ·  5 天前  
51好读  ›  专栏  ›  生信媛

​什么,你嫌bioconda下载速度太慢?

生信媛  · 公众号  · 生物  · 2017-07-29 18:31

正文

我曾经写过两篇关于bioconda的教程,分别是:

生信软件的好帮手-bioconda

世上没有白走的路,每一步都算数

第一篇给大家介绍了什么叫做bioconda, 它是如何解决了我们安装软件需要解决各种依赖的问题。但是在第一篇的时候,我说了”bioconda虽好,就是没有国内镜像,下载速度太慢“、
第二篇,我在某天突然领悟到,原来bioconda解决我们安装软件依赖的途径就是自己准备好软件所需要的依赖包。因此提高下载速度的方法就有了,就是用已有的conda国内镜像源解决依赖包安装问题。

对于一些本身文件就不大的软件,比如说不到10M的压缩包呀,那么不到100kb的下载速度也是等得起的。但是如果遇到200M那么大文件该如何处理呢?

这里我在教大家最后一招: 手动安装大法。
以abyss为例:

第一步


查看abyss需要那些依赖包:


从截图中,我们可以知道abyss依赖于gmp,openmpi, pandoc,这三个软件包。那么我们用上帝归上帝,凯撒归凯撒大法安装好这三个包。

# 这里用-c指定channel能够加快搜索速度
conda install -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge gmp=6.1.2 openmpi=2.1.1 pandoc=1.19.2

让我们检查下,依赖关系是否已经解决了。已经没有像之前那样提示要安装其他包了,就说明解决了依赖关系。

第二步


在https://bioconda.github.io/recipes.html 中搜索abyss。发现abyss就叫abyss

第三步


在 https://anaconda.org/bioconda 频道中下载abyss的压缩包。

因为我们之所以能够下载数据,就是因为该数据在某个服务器上存在过。

然后用你觉得最合适的下载方式,无论是迅雷呀,qq旋风呀,甚至你可以用国外的服务器下载好,复制到国内呀。而我选择用谷歌浏览器下载,

原因只有一个: 没钱充迅雷会员!

这里,求大佬下载,然后分享到百度云盘!

第四步


解压软件包,并复制到目标文件夹。

# 建立一个新的文件夹,用于存放解压缩的文件
mkdir abyss
mv abyss-2.0.1-boost1.61_2.tar.bz2 abyss
tar -jxvf abyss-2.0.1-boost1.61_2.tar.bz2

不难发现,他解压得到的是bin, share, info文件夹,而不是通常的abyss文件。这表明conda的软件管理方式其实和apt/yum是一致的。
如果是自己安装,建议单独建立一个文件夹,便于后续删除。

然后把这些解压缩文件全部拷贝到miniconda下。

cp -r * ~/miniconda2/
# 如果你用的是虚拟环境
cp -r * ~/miniconda2/envs/biostar/

最后检验以下

别走,还有


目前比较流行采用docker部署软件,所以我在bioconda上也发现他们也提供了BioContainer用于快速部署,感兴趣的小伙伴去了解下吧。