专栏名称: 生命科学产业观察
聊聊生命科学产业那些事
目录
相关文章推荐
蚂蚁摄影MaE  ·  会拍照和不会拍照,差别到底有多大? ·  2 天前  
图虫APP  ·  获奖公示 | ... ·  3 天前  
51好读  ›  专栏  ›  生命科学产业观察

国产纳米孔测序仪准确率飞升,凭什么?

生命科学产业观察  · 公众号  ·  · 2024-12-26 08:17

正文

有观点,有态度
这是生命科学产业观察公众号的第 1224-4 期文章
来源:基因江湖

最近几月,测序仪市场可谓百花争鸣、新品不断:

如上表,纳米孔测序平台(华大序风、今是科技、普译生物)产品出新速度,已经呈现出与NGS短读长测序平台(赛陆、Illumina、真迈)齐头 并进的态势。


其中 ,有一家企业,让我们感到很意外:今是科技, 推出纳米孔测序仪G-seq500升级产品,宣称将 单序列准确率提升到了 99.9%(Q30) ,50X一致性准确率提升到了 99.999%(Q50)。

国产纳米孔测序仪的性能,已经这么强了吗?

带着诸多疑惑,我们深入研究了今是科技的相关资料,并对其产品升级研讨会内容进行了详细剖析,力图为大家揭开其中的奥秘。

本篇主要回答3个问题:

(1)测得准,凭什么?


(2)实测表现,究竟如何?


(3)这会给应用市场,带来什么改变?


01

测得准,凭什么?


谈到纳米孔测序仪,就不得不谈纳米孔测序龙头Oxford Nanopore(ONT)。

但一直以来,ONT在测序准确率这一指标上,事实上并不尽如人意。在不断 升级化学试剂、迭代算法后,ONT才终于在2022年发布的Q20+试剂方案中,原始序列准确度达到99%(Q20)。


为什么在“测得准”的这条道路上,ONT会如此艰难? 这或许与其选择的技术路线有关。

  • 经典的“纳米孔链测序”方案及升级难点

ONT采用的是 “纳米孔链测序”技术路线。

如图,具体而言: 在一张薄膜中嵌入若干纳米孔,并在孔的两端施加电压 使得带电的DNA/RNA单链在电场的作用下通过这些孔洞 。当链穿孔一刻,离子电流产生阻断效应,引起电流的变化( 特征阻断电流信号 )。通过实时监测相应的变化图谱,并利用计算机辅助工具进行分析,从而实现核酸序列的测定。


这种测序方案,无需扩增、单分子直接测序、测序读长可达Mb级别,并且省去昂贵的光学信号捕捉系统,体积更小,对使用环境要求更低。


然而,“纳米孔链测序”在技术实现过程中,发现以下 难点


(1)不同碱基的 特征电流差异很小;


(2)每一组特征阻断电流信号,其实是由同时停留在纳米孔中的 多个碱基共同贡献 ,而非单碱基信号,这也给后续 碱基识别算法 提出了极高的要求,尤其是对均聚物序列的判断;


(3)核酸单链 过孔速度极快 ,和纳米孔相互作用的时间通常只有几微秒,过于短暂的信号持续时间让电子元件难以有效捕获。


“碱基间信号差异小、非单碱基信号、信号难以捕捉”,这都给“链测序”准确率的提升造成非常大的挑战。

底层技术原理,决定了ONT“准确率提升”这条路会走得异常艰难。

这就意味着,想要快速突破,必须另想办法。


  • 另辟蹊径的“边合成边纳米孔测序”方案

今是科技, 选择了另外一条技术路线:“边合成边纳米孔测序”:


,时长 00:16

(视频源:今是科技)


如视频所示: 采用 4种特殊修饰物链条(标签) 标记ATCG四种游离核苷酸,这些标签在待测核酸链的复制过程中脱离,并穿过纳米孔,从而产生不同特征阻断电流,通过电流信号采集,分析复制的核苷酸种类,从而获得待测链条序列信息。

这样做,貌似可以带来一些直接的好处:


  • 信噪比提升: 不同碱基的特征信号可以通过标签得以放大,提升了测序电信号的信噪比;

  • 单碱基分辨率: 不同碱基信号间有了清晰的边界,不再像 “链测序”方案中一个信号由过孔的多个碱基共同贡献,从而可以 实现单碱基分辨率的碱基识别。

*“边合成边纳米孔测序”,并非待测链直接穿孔,而是使用4种特殊修饰的链条标签穿孔,每次碱基合成产生一组唯一信号。

理论上,该技术方案原始信号读取准确率的提升较之“链测序”方案会更容易实现。


基于“边合成边纳米孔测序”技术路线,还可以更准吗?


可以, 一条序列,多测几次


只需要对单个DNA分子进行重复测序,就能大大降低原始测序中的随机错误,提高单序列准确率。


02

实测表现,究竟如何?


上文,从技术原理分析了“边合成边纳米孔测序”技术路线,理论上似乎更容易实现准确率的提升。

但真实情况,是否如此呢?

我们先看看厂家自己在发布会中展示的参数和实测情况:

*截图自今是科技技术升级研讨会(下同)


研讨会上,讲者提到,新升级版本,通过启用全新生化系统,配合芯片的改造、算法的进步,在不改变芯片孔数(512k/张)的前提下,核心性能相较老版本有极大提升。具体表现在:

  • 准确率: 原始准确率90%(Q10);单序列准确率99.9%(Q30),50x一致性准确率达到99.999%(Q50);


  • 测序读长: 读长N50>50kb;


  • 数据产量: 单芯片单run可产出5Gb数据;芯片可复用10次,故单张芯片在生命周期内可以产出50Gb的数据。


(1)使用大肠杆菌标准品进行测试:



左图展示了每一个测序序列原始准确率(从电信号直接转化为序列信息),可以看到,其原始准确率平均值、中位值均超过了Q10; 右图是经过算法处理后实际输出的 单序列准确率,Q值平均值超过了Q34, 中位值超过了Q36。

实测数值超过厂家宣传数值。

从90%的原始准确率,提升到超99.9%的单序列准确率,推测实验中采用了重复测序方式,提升了单序列准确率。


(2)与某进口品牌的“头对头”比较:



微生物靶向测序,将同一样本一分为二分别在进口、G-seq500 平台上进行检测。

结果显示,G-seq500测序平台的数据质量平均值分别为Q26和Q22,高于进口品牌的Q12水平;Q值中位值,G-seq500平台在两个样本中分别为Q35和Q34,高于进口品牌的Q12和Q13。


(3)“测序芯片复用10次”的表现:


除准确率以外,我们还重点关注另一关键指标 “测序芯片复用”

对一张芯片进行每次测序3小时,连续测序10次的操作并追踪统计测序结果。


从图中可以看出,在测序芯片的全生命周期内,不同run之间芯片单次数据产量在5-7Gb之间,实测数据均超过厂家宣传的5Gb/run。


G-seq500在测序芯片复用的表现上, 并未发生其他纳米孔测序平台随着复用次数增加,由于孔蛋白失活或堵孔,造成的数据产量显著降低的情况。


这是怎么做到的?

企业技术人员解释, 这得益于今是科技在测序芯片、生化系统上不同的设定。 相较ONT 需要在出厂前把膜及孔蛋白预制到测序芯片上,今是科技 将测序芯片和生化系统分离,测序芯片保持纯物理结构

每次测序前, 测序仪自动进行芯片成膜和纳米孔复合物上膜等过程; 单run测序结束后,自动进行清理,确保无生化组分残留,这样保证了在测序芯片使用寿命周期内,数据产量和质量的稳定。


芯片若可稳定复用,则 会大大降低用户使用成本;用户不用再凑样上机,提高了检测的灵活性。

03

应用市场,如何变化?


前文,我们提到,纳米孔测序由于准确率、通量、稳定性等原因,始终在测序领域处于配角地位,是NGS技术的补充。






请到「今天看啥」查看全文