又到了一周一更的时候了,突然不知道写点儿啥了,翻了翻大纲,觉得重复序列这块还挺有意思的,就拿出来写写。
想当年二代测序还没有降到白菜价的时候,SSR(simple sequence repeat;又叫Microsatellite,微卫星)是大家普遍用来研究群体遗传的一种手段。前几年基本上做个十几对SSR引物,几十个居群,几百个个体。再加上几个叶绿体片段都是可以发到New phytologist或者Molecular Ecology这样的Top期刊上的。而如今风水大涨,SSR的数据量及准确程度已经远远不及二代测序。但是SSR有它的特点:
1. 种类多、分布广,并按孟德尔共显性方式在人群中世代相传。2. 高度多态,其多态性表现为不同个体某一基因位点重复序列的重复次数可不一样,同一个体的两个同源染色体上重复次数也可以不一样,即微卫星DNA拷贝数在不同个体间是可变的。 3. 具有遗传连锁不平衡现象。 4. 均可被转录,有些编码蛋白质,而另一些则位于非转译区的5′端和3′端不编码蛋白质。 5. 在不同基因位点上的微卫星DNA的重复序列可以不同,也可以相同。
微卫星均匀分布于真核生物基因组中的简单重复序列,由2~6个核苷酸的串联重复片段构成,由于
重复单位的重复次数在个体间呈高度变异性并且数量丰富,因此微卫星标记的应用非常广泛。
微卫星位点通常通过PCR扩增,扩增产物通过电泳分析并根据大小分离等位基因进行检测。
而如今做微卫星标记也大都采用毛细管电泳,在这之前我都是一板一板的跑电泳,想当年,我也是跑胶无数(一不小心暴露年龄!!!),被聚丙烯酰胺毒害了的少年。
这里我主要跟大家分享一下用MISA进行SSR分析
MISA-MIcroSAtellite identification tool,微卫星鉴定工具,这个工具可以鉴定简单的微卫星序列和复杂的微卫星序列(可以被一定数量的碱基打断)。微卫星两端的侧翼区是十分保守的,因此我们可以在微卫星的侧翼区进行引物设计,在这里我们使用Primer3进行引物设计。
MISA的下载与安装
mkdir misa
cd misa
wget http://pgrc.ipk-gatersleben.de/misa/download/misa.pl
wget http://pgrc.ipk-gatersleben.de/misa/download/misa.ini
chmod 755 misa.*
./misa.pl
MISA的使用
misa文件夹下有两个文件,分别为misa.pl和misa.ini
misa.pl为鉴定SSR的主程序,misa.ini为misa的参数配置文件,这两个文件要保证在同一个文件夹,或者将这两个文件都添加到环境变量中。
./misa.pl input.fasta
input.fasta 输入文件为fasta格式的序列文件
misa.ini配置文件解读
definition(unit_size,min_repeats): 1-10 2-6 3-5 4-5 5-5 6-5
interruptions(max_difference_between
_2
SSRs): 100
第一行:定义重复单元和最小重复单元数
1-10 表示1个碱基重复数达到10次及10次以上;
2-6 表示2个碱基重复数达到6次及6次以上;
......;这样以此类推。
第二行:复杂微卫星中两个微卫星之间的最大距离
100 复杂微卫星中两个微卫星之间的距离最大为100bp
结果文件:
output.misa和output.statistics
output.misa 输出以TAB为制表符的文件,包括
output.statistics 输出微卫星的类型和频数的统计结果
其他有用的脚本
wget http://pgrc.ipk-gatersleben.de/misa/download/p3_in.pl
wget http://pgrc.ipk-gatersleben.de/misa/download/p3_out.pl
wget http://pgrc.ipk-gatersleben.de/misa/download/est_trimmer.pl
Primer3的下载和安装
wget --no-check-certificate https://sourceforge.net/projects/primer3/files/primer3/2.3.7/primer3-2.3.7.tar.gz/download