专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
生物学霸  ·  博士相亲竟相到 56 ... ·  4 天前  
51好读  ›  专栏  ›  生信人

走进微析世界、盘点核心技术、助力科研成长-塞纳生物篇

生信人  · 公众号  · 生物  · 2024-12-14 07:03

正文

2024年11月20日,第十二届慕尼黑上海分析生化展(Analytica China 2024)在上海成功闭幕。作为分析、生化技术、诊断和实验室技术领域的科技盛会,它汇聚了来自23个国家和地区的1200多家参展企业及合作单位,塞纳生物等国内测序公司也参展其中。本次大会还特别设立了“临床研究与诊断”和“生物技术与研究服务” 两大专题,从产、学、研、结合临床等多维度,全面展示了行业内的创新技术和产品。今天,小编就与大家一同走进微析世界,盘点塞纳生物的核心技术。


一、通过技术拓展知识边界:塞纳愿景

1977年,Frederick Sanger提出了双脱氧终止法(Sanger)测序技术,拉开了基因组学时代的帷幕【1】。1990到2003年,美、英、法、德、日和我国科学家们共同参与了预算达 30 亿美元、堪称生命科学领域的“登月计划”的人类基因组计划(The Human Genome Project)【2】,旨在测定组成人类染色体中所包含的30亿个碱基对组成的核苷酸序列,通过绘制人类基因组图谱,达到破译人类遗传信息的最终目的。


2015年,毕业于北京大学的陈子天博士联合谢晓亮院士、黄岩谊教授团队创立了赛纳生物。在一次采访中,陈子天博士强调“赛纳生物的目标就是基于全自主研发的国产测序平台,构建中国主导的测序新生态”。一路稳步发展到今天,在第10个年头,公司仍秉承着“通过技术拓展知识边界”的企业愿景,不断精雕细琢,打造自主、优质、开放的基因测序平台。


二、稳步发展第十年:塞纳历史

稳步发展到第十个年头的塞纳生物,不仅打破了曾经仅由外资企业垄断的测序市场状态,而且与其他国内测序企业携手构建了由中国主导的测序新生态。


  • 2011年6月:谢晓亮院士及其科研团队在Nature Methods(IF 47.99)提出FLUOROGENIC荧光发生测序化学技术(图1)【3】。该技术解决了不稳定光信号的技术痛点,结合了当时两大主流测序技术的优点,最终实现了测序的高精确度和短循环周期(详见本文第三部分“核心技术”第一点的详细介绍); 

  • 2015年4月:塞纳生物成立,总部坐落于北京亦庄经济开发区;

  • 2017年12月:在此前谢晓亮院士首创的荧光发生测序技术基础上,黄岩谊教授、陈子天博士等人提出了新的测序策略-ECC(error-correction code)纠错码技术。该成果在线发表在Nature Biotechnology(IF 68.164)上(图2)【4】(详见本文第三部分“核心技术”第二点的详细介绍);

  • 2022年6月:S100基因测序仪获欧盟CE-IVDR认证;

  • 2024年2月:S100基因测序仪获批国家药品监督管理局(NMPA)医疗器械注册证(国械注准20243220383)。

1荧光发生测序化学技术在Nature MethodsIF 47.99)发表

2 ECC纠错码技术在Nature BiotechnologyIF 68.164)发表

三、推本溯源:塞纳核心技术

1.FLUOROGENIC荧光发生测序化学技术

在2011年谢晓亮院士及其科研团队提出FLUOROGENIC技术之前,当时的基因测序技术主要有两个方向:“焦磷酸测序(pyrosequencing techniques)”和“基于荧光的测序(Fluorescence-based methods)”。两者各有优缺点:前者焦磷酸测序是边合成DNA边实现测序(SBS,sequencing-by-synthesis),优点为天然DNA合成,不需要化学去除步骤,但不足的是光信号不稳定,即,当加入新三磷酸核苷酸时,荧光素酶水解三磷酸键产生能量,这种能量以光的形式发出,光信号转瞬即逝,需要极灵敏的检测系统捕捉这一瞬间的光信号。这种技术当时的主要代表测序仪是罗氏的454 Genome Sequencer。后者荧光检测(主要代表测序仪Illumina的HiSeq 2000)是基于荧光的测序,优点是可以产生稳定的光信号,但不足是需要很多额外的化学修饰步骤才能产生荧光【5】。


谢晓亮院士及其科研团队提出的FLUOROGENIC荧光发生测序化学技术,兼顾了焦磷酸测序的简单流程和荧光检测的稳定信号,实现了测序的高精确度和短循环周期(图3)。

图 3 FLUOROGENIC荧光发生测序化学技术(来源:塞纳生物官网)

2011年发表在Nature Methods(IF 47.99)上的文章详细介绍了该测序技术【3】。通过DNA聚合酶将非荧光的末端磷酸盐标记的荧光核苷酸(terminal-phosphate labeled fluorogenic nucleotides,TPLFN)并入DNA引物/模板中,释放出标记的非荧光多磷酸,这些非荧光多磷酸被磷酸酶水解后,生成荧光产物(图4a)。图4b 绘制了TPLFN(虚线)和荧光产物(实线)的吸收(蓝色)和发射(绿色)光谱。图4c 展示了工作流程,即:①DNA在PDMS(polydimethylsiloxane,聚二甲硅氧烷)微反应器中被固定在微球上,微反应器中装载有反应混合物,混合物含有DNA聚合酶、磷酸酶和四种TPLFNs中的一种,②它们在低温、密封和加热下触发引物延伸。③在含有DNA模板的微反应器中产生荧光团。④用荧光显微镜成像,解除密封,并在下次操作前清洗。整个SBS过程可以实现在DNA互补链合成时,释放同所延伸核苷酸数目相等的荧光分子,进而达到低错误率。

图 4 荧光焦磷酸测序化学和工作流程(来源:公开发表文献【3】)

接下来,我们了解下硬件模块。测序系统包括三个模块:成像,流体和温度控制(图5)。

成像模块是一个单色荧光显微镜,由激光器、卤素灯、CCD相机、显微镜框架、滤光片组和一个带有一些附加光学元件(相位扰频器和顶帽扩散器)的20倍物镜组成。

流体模块是由旋转选择阀、液压和气动阀、氮气管线和真空管线组成,流体模块可以控制密封、试剂流动和洗涤。流体模块中的真空管线既用于将试剂输送到样品中,也用于密封PDMS微反应器。

热电温度控制器在试剂装入反应器中时,先冷却微反应器,以避免在密封之前大量过多的核苷酸掺入。密封后,温度控制器模块加热微反应器,以实现引物的快速扩展。

图5荧光焦磷酸测序系统示意图(来源:公开发表文献【3】)

最终检验阶段,研究团队首先对“homopolymer ladder(HL,均聚物阶梯)”寡核苷酸进行了测序。之所以首先选择HL寡核苷酸,是因为在理想情况下,信号与均聚物的核苷酸长度是成正比的。结果显示,该测序技术的单读原始精度达到了99%,其中80%的HL测序轨迹是无错误的,可从图6中的黑点直观地看出。此外,所有测序周期数据汇总的信号分布直方图显示,对应于0、1、2、3、4和5个碱基的信号水平,其分离程度很好(图6,右)。

图 6荧光焦磷酸测序图像和信号线性演示(来源:公开发表文献【3】)

为了在任意序列上测试这种测序方法,研究团队还设计了三个准随机DNA模板,这些模板的序列特征具有相当大程度的不同。三个寡核苷酸的测序轨迹如图7a-c。研究团队还对这三个随机寡核苷酸测序的所有36个测序结果,做了汇总分析(图7d)。结果表明,该测序技术在30个碱基的读取长度上保持了至少99%的平均单次读取原始精度,即错误率为1%或更低。

图 7 准随机序列的测序轨迹及全局误差分析(来源:公开发表文献【3】)

2. ECC纠错编码测序技术

ECC“编码+解码”策略,其实概念上并不新鲜,在通讯和存储领域已经有近半个世纪的应用——被有效用来探测和纠正错误。黄岩谊教授、陈子天博士等科研人员整合了多学科力量,耗时7年,最终将ECC策略成功应用于生命科学领域的测序技术中来,提高了测序精度,延长了测序读长。


黄岩谊教授团队新发展了“对偶碱基(dual-base)荧光发生”SBS测序流程【4】。这个流程主要通过对测序试剂按对偶碱基分为三组,这三组由两两匹配而成。然后,对待测DNA序列进行三轮独立测序,产生的三条互相正交的简并序列编码可以互为校验。该流程不仅能够通过解码推导出真实碱基序列信息,而且对单轮测序错误位点也具备校正能力(图8)。

图 8 ECC纠错编码测序技术(来源:塞纳生物官网)

举一个简化的测序错误纠正的例子(图9)。在“位置5”处检测到第一个错误的码字(codeword),并且有三个可能的错误源。在这种情况下,可以从第6位左移来识别和纠正插入错误(insertion error)。同样,在“位置14”处的第二个缺失错误可通过从第14位右移来识别和纠正缺失错误(deletion error)。经过这两次修正后,所有码字都是正确的,并且获得了一个无错误的序列。

图 9 测序纠错举例(来源:公开发表文献【4】)

解码算法是三维立体和动态的(图10)。该科研小组以3位字符串为轴,构建了三维码字空间。每个位点代表一个3位的码字,根据奇偶校验可分为通过(pass)或错误(error)。从位点(1,1,1)开始,当且仅通过Pass校验后的路径方可表示可能的解码DNA序列。科研小组使用动态编程贯穿码字空间,用贝叶斯公式为每条路径分配一个概率。将概率最大的路径往回追溯,确认为已解码的DNA序列。

图 10 三维解码算法(来源:公开发表文献【4】)

最后,在实验室搭建的原理样机上,科研小组获得了单端测序读长250碱基的测试结果,提升了当时的测序读长能力。并且还获得了200碱基读长无错误的实验结果(图11右(d)),大幅度增加了测序精度。图11左(c)是ECC应用前的错误率。

图 11 ECC应用前后的错误率(来源:公开发表文献【4】)

3.BITSEQ简并测序技术

该技术是上面提到的ECC纠错编码测序技术中的重要一环。在荧光SBS反应中,两种碱基在一个反应循环中被混合引入(图12)。一个聚合酶与一个DNA模板(黑色)结合,引物(灰色)有效延伸,重组成双链形式,留下3'-羟基端。对偶碱基的混合允许任何互补的碱基被添加到合成链(彩色)的3'-羟基端,然后释放同所延伸核苷酸数目相等的荧光团分子。

图 12 BITSEQ简并测序技术(来源:公开发表文献【4】)

4.独特的两相流技术

两相流技术构造有机相/水相重复的密封体系,这种生物芯片能精确控制反应开合,提高关键试剂的利用率。

图 13独特的两相流技术(来源:塞纳生物官网)

四、重新定义中国制造:S100测序仪

S100测序仪(图14)打破了外资垄断的行业壁垒,基于赛纳生物的“一步法测序化学、两相流生物芯片、三位编码系统”的核心技术设计开发,实现了设备、试剂、芯片、算法全套国产自主解决方案,且专利覆盖。

图 14 桌面型测序仪S100

五、结语:未来已来

近年来,测序技术已在肿瘤诊疗、感染防控、生殖健康等领域被积极并逐步深入应用。精准检测是临床诊治的关键,尤其在肿瘤领域,不同驱动基因的阳性与否,涉及后续截然不同的治疗思路和策略。如果能够实现三早,即“早筛查、早诊断、早治疗”,那么,患者的长期生存率和临床结局或将可能被改写。这些诊疗提升,离不开先进的检测技术来识别肿瘤的早期信号。因此,兼具深度和精准度的测序工具,尤为关键。另外,准确可靠的检测结果,对科研也是助力,以防弯路和误导。


综上,在技术和资本高度壁垒的测序行业中,塞纳生物已经突破了技术难关,提供了准确、简便、快速的上游解决方案,实现了自主可控的技术创新。我们期待更多国内测序企业带来卓越的技术和产品,助力科学研究,解决临床难题,护航人民健康。


添加微信

精彩推送不错过

参考文献

【1】. Sanger F, et al. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-7. 

【2】. Moraes F, Góes A. A decade of human genome project conclusion: Scientific diffusion about our genome knowledge. Biochem Mol Biol Educ. 2016 May 6;44(3):215-23.

【3】. Sims PA, et al. Fluorogenic DNA sequencing in PDMS microreactors. Nat Methods. 2011 Jun 12;8(7):575-80.

【4】. Chen Z, et al. Highly accurate fluorogenic DNA sequencing with information theory-based error correction. Nat Biotechnol. 2017 Dec;35(12):1170-1178. 

【5】. Baker M. et al. Xiaoliang Sunney Xie. Nat Methods 8, 523 (2011). 


最新文章汇总(持续更新ing)


最新热点方向

1、去年才出的review,今年就有顶刊了——神经免疫

2、医之侠者:中国肺癌领军人物吴一龙

3、陈志坚成果汇总|大概率是华人下一位诺奖获得者

4、《Nature》中肠道菌群研究的正确打开方式

5、这文章才十来分,是被nature撤稿影响了吗?


生信人课堂

1、多组学水平的孟德尔随机化分析套路

2、单细胞+空转王炸组合,探索骨骼肌纤维化巨噬细胞

3、以小博大,紧张刺激:肿瘤耐药研究,从基因到网络

4、零基础入门-单细胞课程

5、史上最全格局打开,细讲基因组学,确定不来学学?


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多






END