专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
目录
相关文章推荐
生物探索  ·  Cell | ... ·  4 天前  
BioArt  ·  专家点评Cancer ... ·  5 天前  
BioArt  ·  Science丨田申/Antónia ... ·  6 天前  
51好读  ›  专栏  ›  BioArt

Science丨俞晓春教授团队解析迄今最完整的小鼠基因组图谱

BioArt  · 公众号  · 生物  · 2024-12-08 10:21

正文


基因组学领域的一个重要目标是获得完整的、精确的基因组序列,这对于理解基因组的结构和功能至关重要。尽管小鼠(Mus musculus)的参考基因组(GRCm39)已经相当完善,但仍存在约7~8%未被解析的区域,尤其是在异染色质和rDNA区域。这些区域富含重复序列,难以使用传统的短读长测序技术进行准确组装。西湖大学生命科学学院俞晓春教授团队在解析小鼠参考基因组方面取得重要进展,相关成果The complete telomere-to-telomere sequence of a mouse genome于2024年12月5日在线发表于Science杂志上。该研究团队通过整合PacBio HiFi、Oxford Nanopore超长、Illumina短读长、Hi-C和BioNano光学图谱等多项测序技术对C57BL/6小鼠的单倍体胚胎干细胞(mhaESC)进行了测序和组装,获得了长度为2.77 Gbp的完整的高质量小鼠参考基因组序列,其中包含215.23 Mbp先前未被鉴定的序列(PUR),填补了约7.7%的基因组空白。


采用Liftoff和新基因预测的方式,mhaESC共注释了22113个蛋白质编码基因。与先前的参考基因组GRCm39相比,mhaESC额外注释了639个蛋白质编码基因,其中新的蛋白质编码基因有140个。这些新的蛋白质编码基因可能参与多种生物学过程,包括转录调控和代谢途径,为未来的研究提供了新的方向。

此项研究同时较为精确的注释了核糖体DNA(rDNA)序列,rDNA作为细胞内重要生物大分子—核糖体组分rRNA的转录模板,在基因组上以串联重复的形式存在,是基因组中结构较为复杂的一类DNA序列。以上基因组测序并结合FISH和ddPCR方法确定了分布在5条染色体上的rDNA拷贝数,并鉴定到3种不同长度的基因间隔区(IGS)。IGS区域是一个复杂的调控单元,包含广泛的保守的结构特征,如启动子、转录终止子和重复元件等,其长度异质性的研究将对未来分析rDNA转录调控起重要作用。

着丝粒是确保细胞分裂过程中遗传物质平均分配的重要区域,其序列组成与结构具有高度复杂性和物种多样性的特点。mhaESC基因组序列组装结果显示小鼠各染色体之间的着丝粒长度具有明显差异,且序列内部富含转座元件和片段重复(SD),同时还有散在的基因分布,表明该区域可能会进行活跃的转录和转座事件,驱动着丝粒区域进行适应性改变等行为。对着丝粒区域的解析有助于人们理解因着丝粒功能缺陷导致的染色体重排、非整倍性等相关疾病的发病机制。

综上,本研究通过长读长测序技术成功完成了小鼠基因组的端粒到端粒组装,填补了现有参考基因组中的空白区域,揭示了新的基因和结构变异。这些发现不仅提高了对小鼠基因组结构和功能的理解,也为基因组学研究提供了重要的技术参考和数据资源。

第一作者刘俊丽博士,第一作者(共同)李麒麟博士,通讯作者为俞晓春教授。

原文链接:
http://doi.org/10.1126/science.adq8191

制版人:十一


BioART战略合作伙伴

(*排名不分先后)


BioART友情合作伙伴
(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。





BioArt

Med

Plants

人才招聘

会议资讯



近期直播推荐