专栏名称: 生信圈

关注生物医学大数据、以及数据分析方法在转化医学研究中的应用进展，讨论与生物信息相关的一切话题。

手把手教您学会宏基因组组组装

生信圈 · 公众号 · · 2017-11-23 21:00

正文

上期为大家剖析了基因组组装的基本原理，本期将从实战操作的角度带大家逐步实践宏基因组组装的具体步骤。宏基因组组装一般首先逐个对样本进行组装，再将所有样本中未参与组装的reads混合起来进行组装。

一输入文件及软件准备

1. 配置config文件

根据质控后的fastq文件（sample1.fq1,sample1.fq2,sample2.fq1.sample2.fq2,sample3.fq1,sample3.fq2）配置每个样本的组装输入文件sample1.config,sample2.config,sample3.config;

Config文件内容如下：

fanfan_117/2017-11-21-15-14-15-9289.png

max_rd_len 表示read的最大长度；

[LIB] 表示文库信息标签；

avg_ins 文库中插入片段平均长度

reverse_seq 序列是否需要被反转，0(不反转)，1(反转)，一般插入片段大于等于2k文库，在建库是会将插入片段进行环化，此时须设置该参数为1；

asm_flags 表示reads用于组装哪个部分，可设为1,2,3, 1表示reads仅用于contig组装，2表示reads仅用于scaffold组装，3表示reads同时用于contig和scaffold组装；

rank 构建scaffold时，不同文库中reads的使用顺序，文库中reads序列越短，级别越高；

q1,q2 用于组装的双端fq文件。

2. 软件

安装SOAPdenovo，下载地址 http://sourceforge.net/projects/soapdenovo2/files/SOAPdenovo2/ ;

安装SOAPaligner，下载地址为http://soap.genomics.org.cn/soapaligner.html

二组装步骤

1. 对每个样本单独组装

组装命令：

SOAPdenovo-63mer all –s sample1.config –K 57 –o sample1 -d 1 -M 3 -u –F -p 10

SOAPdenovo-63mer all –s sample2.config –K 57 –o sample2 -d 1 -M 3 -u –F -p 10

SOAPdenovo-63mer all –s sample3.config –K 57 –o sample3 -d 1 -M 3 -u –F -p 10

参数说明：

-s config配置文件；

-K k-mer的长度；

-o 输出文件前缀；

-d [INT], kmerFreqCutoff, 去除频数小于等于该值的kmers，默认为0；

-M [INT], mergeLevel连接contigs时, 合并相似序列的等级，默认为1，最小值为0，最大值为3，

-u 构建scaffold前屏蔽过高或过低覆盖度contigs，默认屏蔽；

-F 利用reads对scaffolds的gap进行填补，默认不执行；

-p 需要使用的cpu数目，默认8；

输出结果文件：

Sample1.scafSeq：scaffold的fasta序列文件；

Sample1.scafStatistics: scaffold和conitg的统计文件，分布统计了scaffold和contig的数目，序列的一些统计信息，GC含量，N50及N90值等；

2. 通过re-mapping获取每个样本未参与组装的reads

比对命令：

2bwt-builder sample1.scafSeq #对scafSeq构建索引;

Soap -p 6 -r 2 -m 200 -x 400 -a ./cleandata/sample1.clean.fq1.gz -b ./sample1/sample1.clean.fq2.gz -D sample1.scafSeq.index -o sample1_PE.soap -2 sample1_SE.soap -u sample1_UN.fasta

参数说明：

请到「今天看啥」查看全文

推荐文章

中国交建 · 奋进之春丨中交集团中标这些项目⑨

昨天

中国交建 · 中交集团主要领导组织召开公司香港区域机构负责人座谈会

昨天

中国交建 · 创新创效！中交集团科技赋能高质量发展

2 天前

中国交建 · 中交集团召开三届党委第八轮巡视整改专题会议

2 天前

中国城市规划 · 天下事 | 首次被写入政府工作报告，“好房子”好在哪儿？

4 天前

寻找中国创客 · 创客晚报 | 深铁持有万科表决权超越“宝能系” ，宝万之争走向尾声

8 年前

同道大叔 · 水瓶座最近比较烦

7 年前

IT高管会 · 【贪婪是恶】杭州保姆纵火案：贫穷不是错，贪婪才是恶

7 年前

AI科技评论 · 人物 | 2017年英国皇家工程院奖章，他是唯一的华人获得者

7 年前

中国智慧城市导刊 · “创新”分量有多重？总理9天内3次部署！

7 年前

手把手教您学会宏基因组组组装

正文

一 输入文件及软件准备

二 组装步骤

请到「今天看啥」查看全文

一输入文件及软件准备

二组装步骤