专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
51好读  ›  专栏  ›  BioArt

Nat Genet | 人类基因组中的片段重复:揭示变异与基因多样性的联系

BioArt  · 公众号  · 生物  · 2025-02-14 17:30

正文


人类基因组中存在 大量片段重复 (Segmental duplications, SDs 区域,这些区域涉及复制多态性、倒位、缺失等遗传变异,并在基因组演化、遗传多样性和人类适应性方面发挥着重要作用。由于SDs具有高度的序列相似性,它们在常规基因组学方法 (如短读长RNA测序) 中难以进行精确注释。特别是对于高拷贝数的基因,这种困难尤为突出,因为这些基因的拷贝之间的序列相似度可高达99%以上,导致标准RNA测序数据无法有效区分不同的基因副本。这类基因的拷贝数变化 (从几个到几十个拷贝不等) 在不同个体中存在差异,然而,由于技术限制,传统测序方法往往难以准确捕捉到这些拷贝数的变化。

此外,SD区域不仅包含重复的基因,还可能包含重要的调控元素,这些区域对于理解人类基因组的功能以及疾病易感性至关重要。尽管已有一些研究探讨了这些SD区域,但大多数研究要么忽略了这些区域,要么由于技术限制未能深入解析这些复杂的结构变异。在这种情况下,常规的基因组学方法 (如全基因组关联研究、基因调控研究等) 在分析这些区域时通常会将其排除在外,从而影响了我们对SDs基因的全面理解。

为了突破这些技术局限,近年来,长读长测序技术 (如PacBio HiFi技术) 和改进的组装算法得到了应用,能够更精确地解析基因组中高度相似的结构变异区域。这些技术的进步使我们能够解决传统测序方法无法覆盖的SD区域,特别是通过全基因组长读长数据来解析这些复杂的结构变异,为进一步的基因注释和基因功能研究提供了新的机遇。

近日,华盛顿大学医学院的 Evan E. Eichler Nature Genetics 期刊上发表了题为 Structural polymorphism and diversity of human segmental duplications 的文章。该研究 通过利用来自人类基因组参考(T2T-CHM13)和170个基因组的长读长Iso-Seq数据,提供了一个新的视角,深入解析了SDs在基因组中的作用,尤其是它们如何影响免疫等关键生物学过程 。研究的目标是借助高精度的数据和分析方法,更好地揭示SDs在免疫应答、基因复制数变异以及人类基因组适应性进化中的作用,并为进一步的临床和生物学研究奠定基础。


长读长测序 (Long-read sequencing) 揭示的SDs多样性:本研究通过使用PacBio HiFi技术生成的长读长数据,并结合来自170个基因组的组装数据,成功识别了大量的SDs。这些数据为人类基因组中SDs的多样性和复杂性提供了新的认识。通过将这些数据与T2T-CHM13参考基因组进行比对,揭示了约76.4 Mb的可变SD区域,其中60.3 Mb位于染色体内部,16.1 Mb为跨染色体的SD变异。与此相比,发现了147.5 Mb的恒定SD区域,其中89.7 Mb位于染色体内部,57.8 Mb为跨染色体区域。这些结果表明,在人类基因组中,SDs在结构上存在显著的多样性,并且大多数变异出现在染色体内部,而跨染色体的SD变异较为稀少。

人类不同种群的SDs差异:非洲血统样本的染色体内部SD含量显著高于其他种群。这一现象表现为重复基因拷贝数的增加,尤其是在免疫相关基因和环境互动相关基因的复制数方面。这表明这些基因的复制可能是适应性进化的结果。增加的基因复制数可能为非洲种群提供了更大的遗传多样性,使得自然选择能够作用于不同的基因副本,从而产生新的或修改过的功能,可能增强了这些种群在某些环境下的适应性。

新发现的基因与基因家族:在这项研究中,还发现了260个新的蛋白编码基因,这些基因属于206个基因家族,特别是在免疫反应和细胞相互作用过程中发挥着重要作用。许多新基因与免疫相关的生物学过程高度相关,如T细胞外渗、白细胞介导的免疫调节、抗原处理和内源性肽抗原呈递等。这些发现突显了基因组中结构多态性在免疫系统中的潜在重要性,表明SDs不仅是基因组多样性的来源,也是免疫功能多样性的潜在推动力。

重复基因的变异和功能:研究还揭示了多个已知基因重复副本的结构变异,特别是MUC20、GSTM、TUBB8、SIRPB1等基因。这些基因的重复副本在不同人类个体中表现出不同的结构变异,例如氨基端或羧基端的变化,这可能影响蛋白质的功能和表达。例如,17q21.31区段的KANSL1倒位变异会导致LRRC37A/2的蛋白编码转录本发生改变,从而生成一个包含新氨基酸的变异蛋白。这些结果表明,SDs不仅影响基因数量,还可能改变其功能结构,进而在个体之间产生功能差异。

免疫球蛋白超家族的多样性:本研究还发现了20个新基因属于免疫球蛋白超家族,其中10个基因位于核心重复区。这些发现支持了先前的假设,即免疫球蛋白超家族基因的复制和变异在物种进化过程中可能发挥了重要作用。免疫球蛋白基因的多样性可能与抗原识别和免疫逃逸机制密切相关,为我们理解免疫系统的适应性和疾病易感性提供了新的视角。

ZNF972基因的发现与古人类基因组的比较:研究还发现了一个新基因ZNF972,它与人类基因组中已知的ZNF98基因具有69%的序列同一性。ZNF972位于染色体19p12的ZNF基因簇中,虽然这一基因未出现在早期的人类基因组参考中,但在35.9%的人类组装基因组中得到了鉴定。通过与黑猩猩、山地大猩猩和猩猩的基因组进行比较,研究发现该基因在人类和大猩猩基因组中存在,但在黑猩猩和猩猩中可能已经变成伪基因。ZNF972代表了一个祖先的基因重复,揭示了人类基因组中的结构变异与古代人类基因组之间的联系。

综上所述, 本研究揭示了片段重复在不同种群中表现出的复杂性和多样性,尤其是非洲基因组在片段重复及基因家族复制方面的独特性。通过基因组层面的深入分析,本研究为我们提供了关于这些基因变异与人类疾病及进化之间潜在联系的关键线索。

原文链接:
https://doi.org/10.1038/s41588-024-02051-8

制版人:十一


BioART战略合作伙伴

(*排名不分先后)


BioART友情合作伙伴
(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。











请到「今天看啥」查看全文