今天继续聊测序技术平台,聊的是Pacific Biosciences 或者大家更熟知的名字第三代测序领导者 PacBio.
PacBio成立于2004年,由Stephen Turner博士和Jonas Korlach博士在康奈尔大学的基础研究基础上成立。
PacBio的核心技术基于
单分子实时测序
(Single Molecule, Real-Time Sequencing, SMRT)。SMRT技术的核心在于
零模波导(zero-mode waveguides, ZMWs),ZMWs是PacBio 测序
流体芯片
上数百万计的纳米级圆柱形凹槽。
这些纳米级的小孔能够捕捉并固定单个DNA分子,同时允许DNA聚合酶在其内部进行复制过程,对单个DNA分子进行实时观察和分析。
PacBio的测序模式有“长读长” 和 “短读长” 两个平台,分别针对不同的应用场景。
PacBio HiFi Sequencing 测序技术通过SMRT原理实现了测序长读长和高准确性。PacBio的另一项测序技术是Sequencing by Binding(SBB),PacBio SBB 技术主要针对短读长测序。
先讲PacBio“长读长”平台 - HiFi Sequencing 的工作原理。
在PacBio HiFi Sequencing 技术平台上一张测序芯片表片排列15万个直径为70纳米的测序微孔(ZMWs)。
首先样本DNA的环化片段被固定在纳米级的小孔的底部,
DNA聚合酶在样本DNA上添加游离的核苷酸,开始复制过程。
PacBio HiFi Sequencing 使用的是边合成边测序的原理(Sequencing by Synthesis, SBS)。
在过程中游离的
dNTP
被固定在底部的酶捕获,同时被小孔底部激发光激发。
由于测序小孔直径很小,激发光穿透能力会逐渐衰减,只能在小孔中传输很短的距离,只有当dNTP足够靠近底部连接的荧光基团才会被激发光照到发出荧光
。
在测序过程中,微孔内合成测序每添加一个新的核苷酸,就会发出微量的光,由探测器捕捉。通过测量发出的光信号,确定添加的DNA碱基类型。
通过多次复制同一DNA片段,HiFi测序能够通过circular consensus sequencing (CCS)提高序列的准确性
。
在HiFi Sequencing 过程中,
如果样本DNA中的碱基有甲基化修饰,SMRT 原理的合成测序(SBS)速度会明显变慢,而且光谱也会发生改变。
HiFi测序提供15,000至20,000碱基对或更长的读数,使研究人员能够组装参考级基因组和全长RNA转录本。
Sequencing by Binding(SBB)是PacBio的另一个高准确度“短读长”测序平台技术。
Next Generation Sequencing(
NGS
)技术虽然在成本和通量上有所优化,但短读序列的准确性提升有限,通常为每1000个碱基中1个错误(Q30)。PacBio SBB测序技术平台能够生成极低错误率(每10000个碱基中1个错误或更低,Q40+)的序列读数。
PacBio“短读长” 平台 - SBB的工作原理
,
第一步使用聚合酶在DNA链上启动测序过程,3'端带有可逆阻断剂。荧光标记的碱基流入测序单元,与DNA链上的合适位置结合并发出信号。移除3'端的可逆阻断剂,激活下一个碱基的结合。
与SBS技术不同,SBB技术中标记的核苷酸不会被整合到DNA链中,而是在信号被捕捉后被冲走。
由于SBB技术中荧光标记的碱基不直接整合到DNA链中,避免了SBS中荧光标签移除后残留的分子疤痕。
按照惯例,讲了这么多技术,接下来上价值。
PacBio年初吹的牛逼很丰满,现实却很骨感。感觉牛逼属实还是有点难实现啊,我们拭目以待吧。