西湖大学生命科学学院教授俞晓春团队在解析小鼠参考基因组方面取得重要突破,获得了完整的端粒到端粒小鼠参考基因组序列,意味着人类历史上第一次“看清”了小鼠基因组 DNA 全貌。日前,相关研究成果在线发表于《科学》。
小鼠是生命科学研究中最常见的实验动物和模式生物,小鼠的基因组 DNA 信息直接关系到人类健康的探索。目前,小鼠基因“档案”中最完整的是参考基因组 GRCm39,但存在约 7%~8% 未被解析的区域。
俞晓春团队综合了诸多三代基因测序技术,开发了一把能够充分挖掘小鼠基因的“金铲子”。他们以最常用的小鼠 C57BL/6 的单倍体胚胎干细胞为样本,进行了基因测序和组装,获得了长度为 2.77Gbp 的完整高质量小鼠参考基因组序列,其中包含 215.23Mbp 先前未被鉴定的序列,填补了约 7.7% 的基因组空白。
与先前的参考基因组版本相比,该研究额外注释了 639 个蛋白质编码基因,其中全新的蛋白质编码基因有 140 个。这些全新的蛋白质编码基因可能参与多种生物学过程,为未来的研究提供了新方向。
该研究较精确地“看清”了核糖体 DNA 的基因序列,为进一步解析核糖体潜在的蛋白质翻译功能的差异性提供了参考。
此外,该研究还解析了着丝粒区域的基因序列详情。结果显示,小鼠各染色体之间的着丝粒长度具有明显差异,且序列内部富含转座元件和重复片段,同时还有散在的基因分布,表明该区域可能会发生活跃的转录和转座事件,驱动着丝粒区域发生适应性改变等行为。