近年来,空间测序技术的创新结合了转座酶可及染色质测序,使得在组织水平上捕捉空间表观遗传信息成为可能。空间转录组与空间表观基因组的整合则进一步提供了基因表达与染色质开放性之间的空间联系,增强了人们对复杂组织时空基因调控机制的认识和理解,为构建空间细胞图谱、分析细胞通讯和探索肿瘤微环境提供了重要手段。
在空间表观基因组研究中,识别具有空间异质性的染色质区域是一个关键任务。由于空间染色质开放性测序数据的稀疏性和离散程度都比空间转录组测序数据更高,许多基于转录组数据方法的假设不适用于空间染色质开放性数据。此外,现有的单细胞染色质开放性数据分析方法忽略了空间信息,无法捕捉空间组织结构信息。因此,开发新的计算方法来辨识具有空间异质性染色质区域、预测染色质区域共开放模式、检测基因-染色质区域互作成为了空间表观基因组数据分析的重大需求。
为解决这些问题,
清华大学自动化系
江瑞
教授团队提出了国际上首个空间染色质开放性数据特征选择方法Descart
。该方法创新性地构建细胞间相关性图,实现对空间染色质开放性模式的识别,进而辨识具有空间异质性的染色质区域。
Descart整合了染色质开放性和空间位置两种信息,在图构建过程中考虑相邻细胞之间的关系,能够捕捉到细胞以及组织层面的异质性。针对空间染色质开放性数据高度离散的特点,Descart通过迭代更新图结构,逐步优化邻接关系,确保更好地反映细胞之间的空间联系和染色质开放性的局部变化。
Descart在四个不同数据集的全面基准测试中展现出了卓越的性能
。在小鼠大脑数据集上,
Descart能够准确识别出富含细胞异质性和组织结构信息的空间变异特征
;在一个缺乏明确标签的混合物种数据集上,利用聚类标签进行评估,同样显示出Descart在检测组织空间结构方面的优势;在更大规模的小鼠胚胎数据集和另一混合物种数据集上,进一步证明了Descart在识别空间特征时的鲁棒性,并且在空间连续性方面优于其他方法。此外,
Descart利用细胞间相关性图进行数据增强,有效地去噪并恢复数据,提高了下游分析的准确性
。通过模型输出的特征相关性图,利用层次聚类识别与特定细胞类型或组织结构相关的共开放染色质区域。在空间多组学数据中,
Descart还能够捕获基因与染色质区域之间的相互作用强度
,这对于构建基因调控网络具有重要意义。在计算效率方面,
Descart以更短的计算时间实现了高准确性,显示出比其他方法更高的效率
。
总体而言,Descart是国际上首个空间染色质开放性数据特征选择方法,不仅为空间染色质开放性数据分析提供了高效、准确的手段,还拓展了空间多组学数据分析的应用范围,为时空基因调控机制的解析提供了新的工具和视角。
论文得到了中国国家重点研发计划(2021YFF1200902)、中国国家自然科学基金(62273194和61721003)以及北京市自然科学基金(L242026)的资助。文章的共同第一作者是清华大学自动化系20级博士生
陈晓阳
和23级博士生
李可伊
,通信作者是清华大学自动化系长聘教授
江瑞
。清华大学自动化系
吴晓晴、李震、江群、崔雪建、高子靖
和
吴艳红
是文章的其他作者。相关成果于2024年12月30日发表在基因组与生物信息学领域旗舰期刊《基因组生物学(Genome Biology)》。
Genome Biology期刊的缩写为“GB”,在今天这个特殊的日子里也代表着“Greeting & Beginning”。Greeting(问候),代表着温馨的问候与美好的祝愿;Beginning(开始),预示着新的开始和新的机遇。
在此,测序中国也借GB的寓意向各位读者送上最诚挚的元旦祝福:新的一年,愿你每一天都迎接好运气,每一步都踏上新起点!
Chen, X., Li, K., Wu, X. et al. Descart: a method for detecting spatial chromatin accessibility patterns with inter-cellular correlations. Genome Biol 25, 322 (2024). https://doi.org/10.1186/s13059-024-03458-6
·END·