一个完整且注释精准的基因组是解析生物学功能和调控机制的核心基石。基因注释包括编码蛋白基因的编码区(CDS)、非编码区(UTR)、转录起始位点(TSS)和转录终止位点(TES)、非编码RNA,以及基因的可变剪切亚型等关键特征的识别的标注。只有通过高质量的基因注释,才能将基因组序列转化为具有生物学意义的信息。嗜热四膜虫(Tetrahymena thermophila)是一种广泛应用于基础生物学研究的单细胞模式真核生物,曾因核酶和端粒酶的研究分别斩获1989年诺贝尔化学奖和2009年诺贝尔生理或医学奖。四膜虫大核基因组已历经多次组装和注释,其中包括2020年由中国海洋大学高珊教授课题组率先完成的端粒到端粒的完整基因组组装【1】。然而,现有的基因注释仍存在诸多不足,例如基因错误注释、TSS和TES位置不准确,以及UTR信息缺失等。近日,高珊教授课题组通过整合大规模的转录组数据和表观遗传学数据,运用机器学习模型、人工核对和实验验证,深度优化了嗜热四膜虫大核基因组的注释,相关成果Comprehensive genome annotation of the model ciliate Tetrahymena thermophila by in-depth epigenetic and transcriptomic profiling于2024年12月9日在线发表于Nucleic Acids Research 杂志上。研究团队收集了四膜虫不同生长阶段(生长、饥饿和接合生殖)的大规模RNA-seq数据,结合纳米孔直接RNA测序(Nanopore DRS)、链特异性RNA-seq等技术,对基因模型进行了全面校正和重注释。与此同时,还引入了H3K4me3、H2A.Z、6mA、核小体等表观遗传标记,使用机器学习算法进一步优化了基因注释。通过对表观组和转录组数据的整合(图1),团队成功预测了24351个TSS,并基于Cap-seq数据验证了这些TSS的准确性。最终,优化后的基因组新增了2481个基因,并对23936个基因模型进行了修订,其中包括外显子改变、基因合并、基因拆分以及基因方向反转等。此外,研究团队首次注释了26047个基因的UTR,并鉴定出5500个基因的8,339种可变剪切亚型。这些优化显著提升了四膜虫基因组注释的完整性和准确性,不仅强化了四膜虫作为遗传工具在生物学研究中的实用价值,还为其他真核生物的基因组注释提供了有益的借鉴。团队同时鉴定了5525个天然反义转录本(NATs),并发现约20%的蛋白编码基因存在反义转录。NATs通常较短且低表达,但在四膜虫的有性(接合)生殖阶段,其表达水平显著升高。进一步分析表明,大部分NATs与其正义蛋白编码基因呈现互斥的时间特异性表达模式,可能通过与正义基因相互作用,调控其转录或翻译。这一发现为揭示四膜虫的转录调控机制提供了新的视角。图1. 整合转录组和表观遗传数据优化基因模型示意图中国海洋大学高珊教授为文章的通讯作者。高珊课题组博士生叶飞、山东大学陈晓教授和高珊课题组博士毕业生李源为共同第一作者。高珊课题组硕士生鞠艾利、博士毕业生盛亚岚、博士生段丽丽、张佳晨和张喆,以及美国布拉德利大学Naomi A. Stover副教授等对本文亦有重要贡献。
高珊教授课题组的主要研究方向为原生动物表观遗传学,聚焦染色质调控机制研究。以单细胞真核模式生物-四膜虫为材料,围绕DNA甲基化6mA和组蛋白翻译后修饰,多角度地揭示了染色质调控的分子机制及其在真核生物进化中的潜在作用。目前工作聚焦于1)6mA的酶学调控体系和功能分化;2)复制转录冲突的表观调控机制。现招募从事生物信息学研究的博士后1人。有意向者请投递简历。实验室网址:https://scxy.ouc.edu.cn/lplb/2018/0811/c13774a207662/page.htm原文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkae1177/7919455制版人:十一
1. Sheng,Y., Duan,L., Cheng,T., Qiao,Y. and Gao,S. (2020) The completed macronuclear genome of a model ciliate Tetrahymena thermophila and its application in genome scrambling and copy number analyses. Sci. China Life Sci., 63, 1534–1542.
2. Rosa,S., Duncan,S. and Dean,C. (2016) Mutually exclusive sense–antisense transcription at FLC facilitates environmentally induced gene repression. Nat. Commun, 7, 13031.
BioART战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。