单分子实时测序(SMRT)技术的出现以及超过12 kb的平均读长,让科学家如今能够可靠地检测结构变异。最新发表的研究表明,以前的人类基因组数据明显低估了结构变异的数量,以及它们对健康和疾病的影响。
近年来,科学家逐渐意识到人类基因组中结构变异的临床意义。这些较大的变异通常大于50 bp,可能导致许多遗传病,包括脆性X综合征、杜氏肌营养不良症、肌萎缩侧索硬化症(ALS)以及Tay-Sachs病等。然而,由于大小的关系,结构变异并不能像单核苷酸变异那样,通过短读长的测序方法来研究。
它们有些是插入变异,长度超过许多测序技术的读长;有些是重复区域,为序列比对增加难度;有些则是富含GC的区域,为本身有覆盖偏好的技术带来挑战。因此,这些重要的基因组元件往往被过去的人类基因组测序工作所错过,成为被遗忘的角落。
单分子实时测序(SMRT)技术的出现以及超过12 kb的平均读长,让科学家如今能够可靠地检测结构变异。最新发表的研究表明,以前的人类基因组数据明显低估了结构变异的数量,以及它们对健康和疾病的影响。下面我们就来回顾一下。
近期发表的多项研究表明,深入了解结构变异对临床研究人员来说益处多多,可帮助他们研究罕见病和无法诊断的疾病。举个例子,斯坦福大学的Euan Ashley及合作者最近在《GENETICS in MEDICINE》上发表文章,表明长读长测序可以检测一种由结构变异引起的罕见病。
这项研究中的患者从7岁开始患病。他进出医院20年,先后切除了心脏粘液瘤、睾丸肿块、垂体瘤,但始终无法得到明确的诊断。虽然症状与Carney综合征这种罕见疾病的症状一致,但基因检测和短读长的全基因组测序未能检测到致病突变。
于是,Ashley及其团队开始转向PacBio的长读长测序技术。研究终于有了突破性进展,他们发现PRKAR1A中有一段2.2 kb的缺失,这个基因与Carney综合征有关。此时的测序覆盖度是8倍,表明即使是低倍数的长读长覆盖也能带来结构变异的信息,从而提供重要的临床见解。
在另一个例子中,加州大学戴维斯分校的研究人员则利用长读长测序来研究与脆性X综合征相关的重复扩增。这种遗传疾病伴随着X染色体上一段三核苷酸序列(CGG)的扩增。利用SMRT测序技术,这个区域首次被完整测序。要知道,某些病例的CGG重复长达几kb,让之前的测序方法无力招架。
研究人员认为,重复区域的准确计数不仅实现了脆性X综合征的诊断,对于其他重复扩增疾病而言也是至关重要的,比如ALS(俗称渐冻人症)和亨廷顿病。