前两期我们推出了短序列比对软件bwa和SOAPaligner在微生物测序分析中的应用,本期我们将介绍另外一个常用的短序列比对软件
bowtie
。Bowtie是一个超级快速的,并且内存消耗较小的短序列比对工具,比对结果也容易应用于后续的一系列分析。目前分别有bowtie1和bowite2两个版本软件,而bowite2的应用最为普遍。
a) Bowtie1出现的早,所以对于测序长度在50bp以下的序列效果不错,而bowtie2主要针对的是长度在50bp以上的测序的。
b) Bowtie 2支持有空位的比对
c) Bowtie 2支持局部比对,也可以全局比对
d) Bowtie 2对最长序列没有要求,但是Bowtie 1最长不能超过1000bp
a) 安装bowtie2
-
下载:
http://sourceforge.net/projects/bowtie-bio/files/
;例如bowtie2-2.1.0-source.zip
-
编译:解压下载文件,让terminal进入解压后的某一个目录,比如bowtie2-2.1.0, 运行“make”。 若编译没有异常,编译好以后分别运行:chmod 777 bowtie2和./bowtie2;若无问题,则会出现bowtie2的使用信息
-
添加环境变量:在当前用户的主目录下找到隐藏文件”.profile”或者类似的文件,在这个文件后添加PATH,比如:export PATH=$PATH:/home/lib/ProgramFiles/bowtie2-2.1.0/
##这里的路径添加安装路径;最后注销或者运行source ./profile,这样就可以在当前任何目录下使用bowtie2.
b) 安装bowtie1
-
下载:
http://sourceforge.net/projects/bowtie-bio/files/
;例如bowtie-1-0.0-src.zip
-
同bowtie2安装相同,最后环境变量更换相应的路径即可;
a.
对Reference文件(GENOME.fa)建库:
bowtie-build GENOME.fa GENOME.fa;建库步骤可能需要几个小时,建议在后台执行(nohup bowtie-build GENOME.fa GENOME.fa &)。
b.
用法示例
:
bowtie -f -a -m 20 -v 1 --al Reads_aligned --un Reads_unaligned --norc GENOME.fa Reads.fa Reads.bwt 2> log
-
-f 指定query文件为fasta格式
-
-a 保留所有比对结果
-
-m 指定最大比对到基因组的次数
-
-v 允许最大错配数,为[0-2]
-
--al 能map到GENOME的reads,fasta格式
-
--un 不能map到GENOME的reads,fasta格式
-
--norc 不输出匹配到负链的结果;如果不想输出比对到正链的结果,则用'--nofw'。不指定该选项则正负链结果都输出
-
后面依次写上GENOME索引文件,Reads文件,输出结果文件Reads.bwt,日志文件log。