2024年11月20日,第十二届慕尼黑上海分析生化展(Analytica China 2024)在上海成功闭幕。作为分析、生化技术、诊断和实验室技术领域的科技盛会,它汇聚了来自23个国家和地区的1200多家参展企业及合作单位,塞纳生物等国内测序公司也参展其中。本次大会还特别设立了“临床研究与诊断”和“生物技术与研究服务” 两大专题,从产、学、研、结合临床等多维度,全面展示了行业内的创新技术和产品。今天,小编就与大家一同走进微析世界,盘点塞纳生物的核心技术。
1977年,Frederick Sanger提出了双脱氧终止法(Sanger)测序技术,拉开了基因组学时代的帷幕【1】。1990到2003年,美、英、法、德、日和我国科学家们共同参与了预算达 30 亿美元、堪称生命科学领域的“登月计划”的人类基因组计划(The Human Genome Project)【2】,旨在测定组成人类染色体中所包含的30亿个碱基对组成的核苷酸序列,通过绘制人类基因组图谱,达到破译人类遗传信息的最终目的。
2015年,毕业于北京大学的陈子天博士联合谢晓亮院士、黄岩谊教授团队创立了赛纳生物。在一次采访中,陈子天博士强调“赛纳生物的目标就是基于全自主研发的国产测序平台,构建中国主导的测序新生态”。一路稳步发展到今天,在第10个年头,公司仍秉承着“通过技术拓展知识边界”的企业愿景,不断精雕细琢,打造自主、优质、开放的基因测序平台。
稳步发展到第十个年头的塞纳生物,不仅打破了曾经仅由外资企业垄断的测序市场状态,而且与其他国内测序企业携手构建了由中国主导的测序新生态。
2011年6月:谢晓亮院士及其科研团队在Nature Methods(IF 47.99)提出FLUOROGENIC荧光发生测序化学技术(图1)【3】。该技术解决了不稳定光信号的技术痛点,结合了当时两大主流测序技术的优点,最终实现了测序的高精确度和短循环周期(详见本文第三部分“核心技术”第一点的详细介绍);
2015年4月:塞纳生物成立,总部坐落于北京亦庄经济开发区;
2017年12月:在此前谢晓亮院士首创的荧光发生测序技术基础上,黄岩谊教授、陈子天博士等人提出了新的测序策略-ECC(error-correction code)纠错码技术。该成果在线发表在Nature Biotechnology(IF 68.164)上(图2)【4】(详见本文第三部分“核心技术”第二点的详细介绍);
2022年6月:S100基因测序仪获欧盟CE-IVDR认证;
2024年2月:S100基因测序仪获批国家药品监督管理局(NMPA)医疗器械注册证(国械注准20243220383)。
图 1荧光发生测序化学技术在Nature Methods(IF 47.99)发表
图 2 ECC纠错码技术在Nature Biotechnology(IF 68.164)发表1.FLUOROGENIC荧光发生测序化学技术
在2011年谢晓亮院士及其科研团队提出FLUOROGENIC技术之前,当时的基因测序技术主要有两个方向:“焦磷酸测序(pyrosequencing techniques)”和“基于荧光的测序(Fluorescence-based methods)”。两者各有优缺点:前者焦磷酸测序是边合成DNA边实现测序(SBS,sequencing-by-synthesis),优点为天然DNA合成,不需要化学去除步骤,但不足的是光信号不稳定,即,当加入新三磷酸核苷酸时,荧光素酶水解三磷酸键产生能量,这种能量以光的形式发出,光信号转瞬即逝,需要极灵敏的检测系统捕捉这一瞬间的光信号。这种技术当时的主要代表测序仪是罗氏的454 Genome Sequencer。后者荧光检测(主要代表测序仪Illumina的HiSeq 2000)是基于荧光的测序,优点是可以产生稳定的光信号,但不足是需要很多额外的化学修饰步骤才能产生荧光【5】。
谢晓亮院士及其科研团队提出的FLUOROGENIC荧光发生测序化学技术,兼顾了焦磷酸测序的简单流程和荧光检测的稳定信号,实现了测序的高精确度和短循环周期(图3)。
图 3 FLUOROGENIC荧光发生测序化学技术(来源:塞纳生物官网)2011年发表在Nature Methods(IF 47.99)上的文章详细介绍了该测序技术【3】。通过DNA聚合酶将非荧光的末端磷酸盐标记的荧光核苷酸(terminal-phosphate labeled fluorogenic nucleotides,TPLFN)并入DNA引物/模板中,释放出标记的非荧光多磷酸,这些非荧光多磷酸被磷酸酶水解后,生成荧光产物(图4a)。图4b 绘制了TPLFN(虚线)和荧光产物(实线)的吸收(蓝色)和发射(绿色)光谱。图4c 展示了工作流程,即:①DNA在PDMS(polydimethylsiloxane,聚二甲硅氧烷)微反应器中被固定在微球上,微反应器中装载有反应混合物,混合物含有DNA聚合酶、磷酸酶和四种TPLFNs中的一种,②它们在低温、密封和加热下触发引物延伸。③在含有DNA模板的微反应器中产生荧光团。④用荧光显微镜成像,解除密封,并在下次操作前清洗。整个SBS过程可以实现在DNA互补链合成时,释放同所延伸核苷酸数目相等的荧光分子,进而达到低错误率。
图 4 荧光焦磷酸测序化学和工作流程(来源:公开发表文献【3】)
接下来,我们了解下硬件模块。测序系统包括三个模块:成像,流体和温度控制(图5)。
①成像模块是一个单色荧光显微镜,由激光器、卤素灯、CCD相机、显微镜框架、滤光片组和一个带有一些附加光学元件(相位扰频器和顶帽扩散器)的20倍物镜组成。
②流体模块是由旋转选择阀、液压和气动阀、氮气管线和真空管线组成,流体模块可以控制密封、试剂流动和洗涤。流体模块中的真空管线既用于将试剂输送到样品中,也用于密封PDMS微反应器。
③热电温度控制器在试剂装入反应器中时,先冷却微反应器,以避免在密封之前大量过多的核苷酸掺入。密封后,温度控制器模块加热微反应器,以实现引物的快速扩展。
图5荧光焦磷酸测序系统示意图(来源:公开发表文献【3】)
最终检验阶段,研究团队首先对“homopolymer ladder(HL,均聚物阶梯)”寡核苷酸进行了测序。之所以首先选择HL寡核苷酸,是因为在理想情况下,信号与均聚物的核苷酸长度是成正比的。结果显示,该测序技术的单读原始精度达到了99%,其中80%的HL测序轨迹是无错误的,可从图6中的黑点直观地看出。此外,所有测序周期数据汇总的信号分布直方图显示,对应于0、1、2、3、4和5个碱基的信号水平,其分离程度很好(图6,右)。
图 6荧光焦磷酸测序图像和信号线性演示(来源:公开发表文献【3】)
为了在任意序列上测试这种测序方法,研究团队还设计了三个准随机DNA模板,这些模板的序列特征具有相当大程度的不同。三个寡核苷酸的测序轨迹如图7a-c。研究团队还对这三个随机寡核苷酸测序的所有36个测序结果,做了汇总分析(图7d)。结果表明,该测序技术在30个碱基的读取长度上保持了至少99%的平均单次读取原始精度,即错误率为1%或更低。
图 7 准随机序列的测序轨迹及全局误差分析(来源:公开发表文献【3】)
2. ECC纠错编码测序技术
ECC“编码+解码”策略,其实概念上并不新鲜,在通讯和存储领域已经有近半个世纪的应用——被有效用来探测和纠正错误。黄岩谊教授、陈子天博士等科研人员整合了多学科力量,耗时7年,最终将ECC策略成功应用于生命科学领域的测序技术中来,提高了测序精度,延长了测序读长。
黄岩谊教授团队新发展了“对偶碱基(dual-base)荧光发生”SBS测序流程【4】。这个流程主要通过对测序试剂按对偶碱基分为三组,这三组由两两匹配而成。然后,对待测DNA序列进行三轮独立测序,产生的三条互相正交的简并序列编码可以互为校验。该流程不仅能够通过解码推导出真实碱基序列信息,而且对单轮测序错误位点也具备校正能力(图8)。
图 8 ECC纠错编码测序技术(来源:塞纳生物官网)
举一个简化的测序错误纠正的例子(图9)。在“位置5”处检测到第一个错误的码字(codeword),并且有三个可能的错误源。在这种情况下,可以从第6位左移来识别和纠正插入错误(insertion error)。同样,在“位置14”处的第二个缺失错误可通过从第14位右移来识别和纠正缺失错误(deletion error)。经过这两次修正后,所有码字都是正确的,并且获得了一个无错误的序列。
图 9 测序纠错举例(来源:公开发表文献【4】)
解码算法是三维立体和动态的(图10)。该科研小组以3位字符串为轴,构建了三维码字空间。每个位点代表一个3位的码字,根据奇偶校验可分为通过(pass)或错误(error)。从位点(1,1,1)开始,当且仅通过Pass校验后的路径方可表示可能的解码DNA序列。科研小组使用动态编程贯穿码字空间,用贝叶斯公式为每条路径分配一个概率。将概率最大的路径往回追溯,确认为已解码的DNA序列。
图 10 三维解码算法(来源:公开发表文献【4】)
最后,在实验室搭建的原理样机上,科研小组获得了单端测序读长250碱基的测试结果,提升了当时的测序读长能力。并且还获得了200碱基读长无错误的实验结果(图11右(d)),大幅度增加了测序精度。图11左(c)是ECC应用前的错误率。
图 11 ECC应用前后的错误率(来源:公开发表文献【4】)
3.BITSEQ简并测序技术
该技术是上面提到的ECC纠错编码测序技术中的重要一环。在荧光SBS反应中,两种碱基在一个反应循环中被混合引入(图12)。一个聚合酶与一个DNA模板(黑色)结合,引物(灰色)有效延伸,重组成双链形式,留下3'-羟基端。对偶碱基的混合允许任何互补的碱基被添加到合成链(彩色)的3'-羟基端,然后释放同所延伸核苷酸数目相等的荧光团分子。
图 12 BITSEQ简并测序技术(来源:公开发表文献【4】)
4.独特的两相流技术
两相流技术构造有机相/水相重复的密封体系,这种生物芯片能精确控制反应开合,提高关键试剂的利用率。
图 13独特的两相流技术(来源:塞纳生物官网)
S100测序仪(图14)打破了外资垄断的行业壁垒,基于赛纳生物的“一步法测序化学、两相流生物芯片、三位编码系统”的核心技术设计开发,实现了设备、试剂、芯片、算法全套国产自主解决方案,且专利覆盖。
图 14 桌面型测序仪S100
近年来,测序技术已在肿瘤诊疗、感染防控、生殖健康等领域被积极并逐步深入应用。精准检测是临床诊治的关键,尤其在肿瘤领域,不同驱动基因的阳性与否,涉及后续截然不同的治疗思路和策略。如果能够实现三早,即“早筛查、早诊断、早治疗”,那么,患者的长期生存率和临床结局或将可能被改写。这些诊疗提升,离不开先进的检测技术来识别肿瘤的早期信号。因此,兼具深度和精准度的测序工具,尤为关键。另外,准确可靠的检测结果,对科研也是助力,以防弯路和误导。
综上,在技术和资本高度壁垒的测序行业中,塞纳生物已经突破了技术难关,提供了准确、简便、快速的上游解决方案,实现了自主可控的技术创新。我们期待更多国内测序企业带来卓越的技术和产品,助力科学研究,解决临床难题,护航人民健康。
添加微信
精彩推送不错过
参考文献
【1】. Sanger F, et al. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-7.
【2】. Moraes F, Góes A. A decade of human genome project conclusion: Scientific diffusion about our genome knowledge. Biochem Mol Biol Educ. 2016 May 6;44(3):215-23.
【3】. Sims PA, et al. Fluorogenic DNA sequencing in PDMS microreactors. Nat Methods. 2011 Jun 12;8(7):575-80.
【4】. Chen Z, et al. Highly accurate fluorogenic DNA sequencing with information theory-based error correction. Nat Biotechnol. 2017 Dec;35(12):1170-1178.
【5】. Baker M. et al. Xiaoliang Sunney Xie. Nat Methods 8, 523 (2011).