专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
目录
相关文章推荐
生物学霸  ·  投资 55.12 亿,新「海洋大学」来了 ·  16 小时前  
生信人  ·  术前ctDNA检测在早期NSCLC中的临床实用性 ·  3 天前  
BioArt  ·  CRSIPR文库+KO细胞,开学放肆购! ·  2 天前  
BioArt  ·  【DeepSeek专栏】Mol Cell ... ·  2 天前  
生物制品圈  ·  重大突破!PELO 基因成抗癌新靶点 ·  5 天前  
51好读  ›  专栏  ›  BioArt

​Genome Biol | 陈璐/毛亚飞团队利用完整参考基因组精细分析现代人基因组中尼安德特渗入序列

BioArt  · 公众号  · 生物  · 2025-02-19 08:31

正文


随着考古学和现代进化遗传学等学科的交叉融合,尼安德特人和丹尼索瓦人等远古人类基因组数据的有效获取使得古人类与现代人类之间的基因混合研究成为可能。相关研究揭示了古人渗入序列在现代人类遗传结构和进化适应中的独特遗传贡献。前期研究表明,非洲以外人群基因组普遍携带约2%的尼安德特人DNA,同时,非洲人群也携带比以往认为的更多的尼安德特人遗传成分 【1】 。此外,大洋洲的个体拥有约2-5%的丹尼索瓦人遗传成分,亚洲人群中也有较少量的丹尼索瓦人基因序列。因此,准确鉴定现代人类基因组中的远古人类渗入基因序列,对于理解人群混合中渗入序列的遗传特征、功能特性、表型进化影响等至关重要。

然而,古人渐渗研究长期依赖于GRCh37 (hg19) 人类参考基因组。但该基因组参考序列存在大量未组装或组装错误的基因组区域,阻碍了我们对于古人渐渗的全面理解。T2T-CHM13作为首个完整人类基因组,填补了先前未测序或错误组装的参考基因组区域 【2】 。因此,T2T-CHM13基因组的高度完整性为我们重新评估和深化现代人群中远古人类渗入序列的理解提供了独特机会。

2025年2月17日,复旦大学 陈璐 团队和上海交通大学 毛亚飞 团队合作在 Genome Biology 期刊上发表了文章 A Refined Analysis of Neanderthal-Introgressed Sequences in Modern Humans with a Complete Reference Genome 该研究表明, 完整参考基因组T2T-CHM13在鉴定现代人群中尼安德特渗入序列方面具有显著优势,并深入解析了T2T-CHM13特异性远古人类渐渗信号及其基因组特性,并阐明了群体特异性古人遗传变异对功能表型的全新影响。


研究人员将阿尔泰尼安德特人和丹尼索瓦人的高覆盖度基因组测序数据分别比对到GRCh37、GRCh38 (hg38) 和T2T-CHM13参考基因组,获得三组古人基因组遗传变异图谱。进一步,研究人员利用陈璐团队先前开发的IBDmix方法,基于1000 Genomes Project (1KGP) 中2504个非亲缘个体遗传变异数据以及古人基因组遗传变异图谱,分别鉴定了基于三个参考基因组的1KGP现代人群全基因组尼安德特渗入序列,并解析出T2T-CHM13特有的基因组渐渗区域与群体特异的适应性渗入信号,最终将基于三个参考基因组的现代人群中尼安德特渗入片段及适应性渗入信号编纂到数据库网站ArcSeqHub (ASH, http://www.arcseqhub.com) (图1)

图1 完整流程图。

研究人员首先比较了不同参考基因组下古人测序数据的比对质量。结果发现,相较于GRCh38,T2T-CHM13额外比对约1.9×10⁷条尼安德特人测序读段,全基因组比对率显著提高,近端着丝粒染色体比对率从约80%提升至>95%。Wilcoxon秩和检验显示,T2T-CHM13提升了尼安德特测序数据的覆盖均一性,显著提高了测序数据的比对质量,同时,在丹尼索瓦人数据分析亦得出相同结论。

研究人员在检测古人基因渐渗时,发现GRCh38和T2T-CHM13版本的1KGP公开遗传变异数据集采用的预过滤策略存在显著差异。T2T-CHM13版本的1KGP公开数据集中采用的更严格的变异质量评分 (VQSLOD) 过滤了大量变异位点,从而在IBDmix算法逻辑下显著减少了尼安德特人序列鉴定。因此,该研究统一采用GRCh38的预过滤策略,以确保高质量数据并避免过度过滤,强调了二代测序数据过滤策略选择的重要性。

基于统一的遗传变异数据预过滤策略,研究人员分析了在T2T-CHM13新鉴定出的尼安德特序列。结果发现相比于GRCh38,使用T2T-CHM13使得现代人群体中检测到的尼安德特序列含量大约多出1Mb/人,新鉴定到尼安德特渗入的基因组区域共51.3Mb,其中1.68Mb位于T2T-CHM13“新解析”区域。

随后研究人员进一步分析了T2T-CHM13新鉴定出的尼安德特渗入片段的产生原因。结果发现约75%的尼安德特渐渗新区域与4,196个T2T-CHM13相较于GRCh38特有的组装遗传变异 (插入、缺失、倒位) 重叠,这些参考基因组组装变异大小从10bp到1.16Mb不等,足以影响古人数据的比对与变异鉴定质量。其中,T2T-CHM13的9号染色体上的~1kb插入变异 (chr9_110M) 使得该区域首次鉴定出尼安德特渗入序列,并且相关渗入序列广泛存在于非洲以外人群 (群体频率大于5%) 。有趣的是,该基因组区域与先天性重症肌无力综合征相关的 MUSK 基因重合。

研究人员进一步分析检测了群体特异的适应性渗入信号。研究表征了T2T-CHM13中94个现代人特异高频尼安德特单倍型,其中10个为全新发现的单倍型,包括2个非洲特异、2个非非洲共享、4个非洲/欧洲共享以及2个非洲/东亚共享高频单倍型。相关单倍型包含代谢、离子通道、嗅觉及癌症等相关基因。以上研究表明了完整参考基因组可揭示新的适应性渗入信号,深化我们对人类进化与基因选择的理解。

图2 ArcSeqHub (ASH)可视化数据库网站

最后,为利于古人渐渗相关研究,该研究还开发了一个集成GRCh37、GRCh38和T2T-CHM13尼安德特渗入序列的用户友好型在线数据库网站:ArcSeqHub (ASH, http://www.arcseqhub.com) 。ASH提供“基因查询”和“基因组区间查询”两种搜索方式,并能对尼安德特渗入序列、功能基因及人群/个体的渐渗比例等进行可视化展示。ASH中的相关原始数据均可免费下载。因此,ASH有助于医学和进化生物学相关科研人员更为便捷地获取和使用古人渐渗遗传变异相关信息。

综上 ,该研究提升了现代人类中远古人类变异的检测能力,强调完整参考基因组T2T-CHM13在古人渐渗研究中的应用价值,突出了针对具体研究场景选择二代测序数据预处理过滤参数的重要性,提供了远古人类渗入变异可视化数据库,为解析古人类遗传变异、功能及进化意义提供了新视角。

复旦大学博士生梁申奥、上海交通大学研究生任天鑫和复旦大学博士生张家瑜为论文共同第一作者。复旦大学青年研究员陈璐和上海交通大学副教授毛亚飞为本文的共同通讯作者。本研究得到了中国科学院古脊椎动物和古人类研究所付巧妹研究员的重要支持。


复旦大学陈璐研究组聚焦于人类遗传和表型进化的基因组研究,运用群体遗传学和计算生物学手段,结合新算法开发,解答“遗传变异对人类表型及进化的作用及其机制解析”这一关键问题。主要研究方向一:远古人类与现代人的人群混合及进化历程;二:环境适应性及表型进化;三:疾病及复杂表型相关遗传变异及其遗传机制。研究组长期招收/聘具有计算生物学、生物信息学、遗传学、进化生物学等多学科背景的研究生、博士后和研究助理。

上海交通大学毛亚飞研究组专注灵长类演化医学研究,以演化生物学、计算生物学、神经生物学和大规模功能筛选等交叉学科手段解析灵长类特有适应性性状形成和人类疾病风险位点发生的遗传机制。研究组长期招收/聘具有演化生物学、生物信息学、细胞生物学、神经科学、计算科学等多学科背景的研究生、博士后和研究助理,为有志于从事灵长类演化医学研究的优秀人才提供广阔的发展平台。如果您对该研究组的研究方向感兴趣,并具备相关专业背景和技能,欢迎访问研究组介绍网站(https://www.yafmao.org/)了解更多信息。

制版人:十一



参考文献


1. Chen L, Wolf AB, Fu W, Li L, Akey JM. Identifying and Interpreting Apparent Neanderthal Ancestry in African Individuals. Cell. 2020;180:677-687 e616.

2. Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A, Vollger MR, Altemose N, Uralsky L, Gershman A, et al. The complete sequence of a human genome. Science . 2022;376:44-53.


BioART战略合作伙伴

(*排名不分先后)


BioART友情合作伙伴
(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。







请到「今天看啥」查看全文