专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
BioArt  ·  Cell | ... ·  2 天前  
生物制品圈  ·  3.45 亿美元已成功出海!这款泛 RAS ... ·  4 天前  
51好读  ›  专栏  ›  生信人

二代测序中的目标区段捕获技术简介

生信人  · 公众号  · 生物  · 2017-09-13 08:09

正文

二代测序已经问世十年了,最突出的特点就是通量的急剧增加和测序成本的急剧下降。现在1000美元即可完成个人的全基因组测序的目标已经实现了。但是很多人并不关心全基因的序列,只是关心部分基因序列或者区段,这样如何在测序前将这些区段富集就是一个研究的热点了,因此催生了测序前目标区段捕获的研究。

本人将介绍一下现在常用的目标区段捕获技术,这些技术主要分为三类: hybridcapture(杂交捕获),molecular inversion probes(分子倒置探针,MIP)和 PCR。

注:说明引物池的问题,因为有些科研人员是针对某个基因进行全测序,那么设计引物时相邻的引物是有over

1. 杂交捕获


杂交捕获的原理是人为设计探针(DNA或者RNA形式),探针可以和目标区段部分或者全部互补。将样本和探针混合,探针会将目标区段捕获,未设计探针的区段会被洗脱丢弃,之后通过变性(一般是调节PH值到碱性)将探针和捕获区段分开,被捕获的片段即可进行二代测序文库构建。

根据探针的状态不同,杂交捕获又因为杂交状况不同分为固态杂交和液态杂交。

A 固态杂交 :本质就是芯片,芯片上布满了探针,典型的是罗氏公司的NimbleGen。其特点是DNA探针,探针长度为50-105bp不等。其探针密度和序列都可以由研究人家自己设置(相对而言,针对一个区段的探针密度越大,其捕获成功率越高)。


B 液态杂交 :探针存在液相中。探针携带生物素,当探针和目标区段杂交完成后,通过磁珠可以将探针吸附(此时探针有携带目标区段的和空探针),将未被捕获的片段扔掉。之后通过变性可以将探针和目标区段分开,然后利用磁珠将所有空探针吸附丢弃,目标区段捕获完成。典型的是安捷伦公司的AgilentSureSelect技术,其探针是RNA探针,长度在120bp(illumina公司的illumina TrueSeq 探针为DNA,长度为95bp的液态探针)。


杂交捕获的优缺点:


杂交捕获最大的优点是捕获区段大,可以达到几百MB,远超PCR方案和MIP方案,同时根据探针的原理其均一性很好(均一性是评价捕获技术很关键的参数,均一性好后续测序成本就会下降)。但是杂交捕获的缺点也是明显,因为杂交前样本会被随机打断(一般认为500bp是比较合适的长度),探针捕获时可能和目的片段部分杂交,导致一些含有部分目标区段的片段被捕获。所以杂交捕获的特异性较差,容易捕获非目标区段。


2. MIP


MIP技术本质上是以连接-PCR反应捕获的技术,其优势是特异性好而且捕获完成后的片段直接完成了建库(杂交捕获后还需要构建测序文库,主要是添加index和测序接头)。其原理是设计一个口袋状探针,探针分为三部分(如上图),蓝色部分为通用序列(为后续构建文库所用),探针的5端和3端(彩色)能和目标区段退火,然后利用DNA聚合酶将探针缺口补齐,同时添加DNA连接酶,将缺口处磷酸二酯键连接,即可构成一个完整的环状探针。剩余未捕获探针和DNA序列通过外切酶消化(完整环状探针不受外切酶影响)。


完整的环状探针已近包含了目标区段序列。利用蓝色通用序列作为后续文库构建的引物(同时添加index和测序引物),扩增后产物可以直接作为二代测序文库。

MIP的有点是特异性好,捕获区段位于中游,高于PCR方案,但是低于杂交捕获方案。同时其缺点是捕获效率不高,有些区段难以设计探针和捕获。


3.PCR


PCR方案是本人的研究项目,同时PCR-目标区段捕获也是商业化应用最广泛的,因为什么呢!首先是便宜,不管引物的设计还是体系的价格都是最简单的,而且设计门槛低,不需要特殊的实验设计。相对于杂交捕获的花费(探针和杂交条件),多重PCR-目标区段捕获是极低的花费,而且适合大规模样本(这是本人研究多重PCR方案的关键,最适合大规模样本和少片段的富集。PCR富集手段实在太多,有长片段PCR,短片段PCR,乳液PCR,拯救PCR等等(都可以开个专题了),这里本人只介绍3种商业化的,经过市场验证的方案(这三种方案都是多重PCR)。

1) Ion Ampliseq(Thermo FisherScientific)

Ion Ampliseq技术最关键的地方是引物设计,Thermo公司非常厉害,引物设计的人员实在太厉害(申请了专利),他们设计的引物可以满足1000-2000重单管反应不产生影响后续分析的引物二聚体和非特异产物。该方案就是你给需要捕获的序列,人家设计好引物池给你,你直接按照说明书做就好了。

备注:说明引物池的问题,因为有些科研人员是针对某个基因进行全测序,那么设计引物时相邻的引物是有overlap的(也是为了二代测序数据处理准确性,必须要有的),因此扩增时需要把相邻的引物分在两管内,防止相邻引物的上游和下游相互作用。


2)illumina TrueSeq(illumina)

该方案和MIP方案类似,也是以延伸-连接-PCR三部分组成的文库构建方案。针对目标区段设计两段探针(和引物长度一致18-21bp即可),探针和DNA双链中一条链杂交(两段探针杂交在一条链上),通过DNA聚合酶和DNA连接酶的作用,将两探针间缺口补齐。上下游探针携带有通用序列,之后利用携带了通用序列的建库引物(携带index和测序引物)进行扩增后即完成了文库构建,可以直接用于后续二代测序。


3) 接力引物

该技术的核心是Ω引物,引物是分为三部分,从5-3端依次是5端序列、Ω环和3端序列,其中5端序列和3端序列是和目标区段互补的,但是Ω环不是,这个环首先是通用序列(用于后续文库构建),其次这个环保证了扩增的特异性,减少引物二聚体和非特异性扩增。








请到「今天看啥」查看全文