NGS建库流程包括核酸打断、末端修复、接头连接、PCR富集几个主要步骤,其中用到的关键工具酶有哪些呢?
片段化酶
市面上可用于核酸打断的片段化酶包括Tn5转座酶、Fragmentase、
DNase I
和Endonuclease V等,其中Fragmentase是目前NGS最为常用的片段化酶。
脱氧核糖核酸酶I
(DNase I,Deoxyribonuclease I),是一种可以消化单链或双链DNA产生单脱氧核苷酸或单链或双链寡脱氧核苷酸的核酸内切酶。DNase I水解单链或双链DNA后的产物,5'端为磷酸基团,3'端为羟基。DNase Ⅰ酶切底物DNA通常依赖于钙离子,并能被镁离子或二价锰离子激活。DNase Ⅰ对嘧啶核苷酸旁边位点有偏好性,会影响终文库的多样性。
核酸内切酶 V
(Endonuclease V) 又称脱氧次黄嘌呤核苷 3´ 内切酶,是在大肠杆菌中发现的一种 DNA 修复酶。识别含脱氧次黄嘌呤核苷(无论配对与否)的双链和单链 DNA,也可识别含脱碱基(AP)位点或尿素、碱基错配、插入/缺失错配、
发夹结构
、未配对 loop 环、折叠 flap 和类 Y 型结构的 DNA,但是识别后者的能力不如前者。普遍认为核酸内切酶 V 发挥 DNA 修复功能时,还需要其它蛋白的存在,因为该酶不能切除 DNA 上的脱氧次黄嘌呤核苷或受损碱基。
Endonuclease V可特异性识别尿嘧啶,因而可以通过调节DNA中尿嘧啶的残留量来控制最终Endonuclease V酶切的长度。在没有dUTP的情况下,DNA不会被酶切,当dTTP/dUTP的比例降低时,片段的平均长度也随之降低,当dUTP完全替代dTTP的时候,DNA会被切割的很短。
Fragmentase
是NEB公司推出的一款片段化酶,是两种酶按一定比例组合成的混合酶体系,一种酶在DNA双链上随机产生缺刻,另一种酶识别这个缺刻并在互补链上切割,从而产生DNA双链断裂。Fragmentase进行双链DNA片段化反应后产生带有5’磷酸和3’羟基的短突出粘性末端DNA片段。Fragmentase是时间依赖型酶,通过改变酶切时间将DNA酶切至特定大小的DNA片段,与初始的DNA量以及 DNA长度无关。
Tn5转座酶
可以在体外结合IS序列(插入序列,最简单的转座元件),并对双链DNA进行切割,然后会在DNA两端连上与Tn5结合的IS序列。所以与其他片段化酶不同的是,Tn5酶可在打断DNA后直接连上接头,酶切后可直接进行扩增得到文库,大大方便了建库过程。
末端修复+A
打断后的DNA会产生5'/3'黏性末端以及平末端,而所有的黏性末端都需要转为平末端,包括3'突出末端切平、5'突出末端补平。在使用TA连接的方式进行接头连接时,DNA片段还需要5'端磷酸化和在3'端加“A”,才能与带“T”黏性末端的接头互补配对。以上过程由T4 DNA聚合酶、
T4多聚核苷酸激酶
、Taq DNA聚合酶协作完成。
T4 DNA聚合酶
具有5'→3'DNA聚合酶活性,可沿 5'→3'方向催化合成 DNA,补平5'突出末端;同时该酶也具有3'→5'外切酶活性,能够用于3'突出末端的切平,从而将含黏性末端的DNA片段转变为平末端DNA。
T4 PNK
是一种多聚核苷酸5'羟基激酶,同时具有激酶活性和磷酸酯酶活性,一般主要用来催化ATP的γ位磷酸基团向单链或双链DNA、RNA、
寡核苷酸
的5'羟基转移,即5'末端磷酸化。由于人工合成的PCR引物、接头等5'端通常都是羟基基团而不是磷酸基团,因此需要T4多聚核苷酸激酶(T4 Polynucleotide Kinase,T4 PNK)在ATP 存在时催化ATP的γ-磷酸基团转移到寡核苷酸链的5'端羟基末端上,为下一步连接接头做准备。
Taq DNA聚合酶
具有5'→3'聚合酶活性,可以从5'→3'方向合成DNA,同时它具有的脱氧核苷酸转移酶活性可以在PCR产物的3'末端添加一个核苷酸“A”。
接头连接
接头连接一般用
T4 DNA连接酶
,它可以修复双链DNA上的单链切口,使两个相邻的核苷酸重新连接起来,在接头连接中可将带有“T”黏性末端的接头和带“A”黏性末端的DNA片段连接起来形成一个完整的双链。