单细胞转录组测序(scRNA-seq)是在单细胞水平上研究基因表达差异的技术,为细胞异质性研究提供了有力手段。而单细胞ATAC测序(scATAC-seq)是利用转座酶在单细胞水平上研究染色质开放性的技术,可以提供高分辨率的单细胞染色质开放图谱,有助于深入研究细胞异质性的表观遗传调控机理。它们的研究对象一个是mRNA,一个是染色质,而染色质开放性在很大程度上决定了基因的表达。因此,通过将scRNA-seq和scATAC-seq相结合,可以同时获得单个细胞的基因表达和染色质可及性的数据,这有助于我们深入了解从DNA到RNA再到表型的调控网络,帮助我们寻找核心基因和调控因子。今天,我们将探讨两组学数据关联分析的思路并结合案例来讲解思路应用的方法。
两组学关联分析的核心在于通过相同细胞亚群的上调基因和上调peak分析来鉴定核心TF和靶基因,接着可以对目标亚群进行深入分析,最后通过实验验证目标细胞或基因的功能。
首先,通过scRNA-seq数据分析,我们可以识别和鉴定出不同的细胞亚群。接着,我们可以使用scRNA-seq的数据来注释scATAC-seq的细胞亚群,最后我们可以通过WNN分析将scATAC-seq和scRNA-seq数据进行整合,构建两组学整合的细胞图谱,并比较两组学的一致性。通过两组学数据的相互验证,可以帮助我们更准确地识别细胞亚群且更深入分析细胞的异质性。
接着,通过scRNA-seq数据分析,我们可以识别出不同亚群的上调基因。通过scATAC-seq数据分析,我们可以鉴定出不同亚群的上调peak相关基因和TF。通过将这二者的数据相结合,我们可以识别出不同细胞亚群的和核心TF和靶基因。
随后,根据筛选出的核心TF和靶基因,我们可以构建TF与靶基因的调控网络,以揭示关键信号通路和基因表达模式在不同处理、时间和空间上的变化及其与表型的关联。也可以与拟时分析相结合从而寻找驱动细胞分化的关键调控因子。此外,可以结合两组学结果对目标细胞亚群进行亚群细分以深入分析细胞的异质性。
最后,针对以上的关联分析结果,可以对目标细胞进行流式分选和测序,也可以选取关键基因进行实验验证,如通过免疫荧光、原位杂交、基因敲除、过表达等验证其在目标细胞中的作用。
接下来根据下面两个案例带大家来看看上面的研究思路在分析中具体是怎么应用的。
在这篇24年发表在
Blood
(IF=21)的文章中,作者利用scRNA-seq和scATAC-seq探究了人类浆细胞分化早期阶段的表观遗传和转录调控机制。首先,通过scRNA-seq(图2A)和scATAC-seq(图2B)分别鉴定了不同的细胞亚群:记忆B细胞(MBC),浆细胞(PC)和前体浆细胞/浆细胞母细胞(prePB/PB)。接着对scRNA-seq和scATAC-seq数据进行了整合分析,结果显示两组学数据集在MBC和PC阶段具有的良好的重叠(图2CD)。而来自ATAC-seq数据集的近一半的prePB未被预测为prePB,近四分之一的PB未被预测为PB(图2E)。有趣的是,剩余的prePB被预测为PB和PC,剩余的PB被预测为PC(图2F)。总之,这里使用了第一个研究思路,比较了两组学的一致性,揭示了一些prePB和PB具有更成熟的表观遗传谱。
接下来,作者对prePB和PB亚群进行了拟时分析(图3ABC),并探究了编码转录因子(TFs)和表观遗传调控因子(EEs)基因随拟时间值的变化(图3D)。发现转录因子
PHB2
、
TFAM
、
ETS1
等在C2中下调。表观遗传因子
AICDA
、
EZH2
、
EED
在早期到成熟prePB的过渡期下调,而
PCNA
、
PRMT1
、
SET
等在从prePB到PB的过渡期下调。此外,还对prePB和PB细胞进行了细胞亚群细分,划分为5个亚群,包括早期prePB、早期成熟prePB、过渡成熟prePB、成熟prePB和增殖PB(图3E)。这些亚群代表了不同的分化阶段,并拥有不同的基因表达谱(图3F)。总之,这里使用了第三个研究思路,对目标细胞亚群进行了拟时分析和亚群细分,深入揭示了不同细胞亚群的异质性。
在这篇24年发表在
Nature Communications
(IF=17)的文章中,作者利用单细胞多组学(scRNA-seq和scATAC-seq)探究了小鼠次级腭发育过程中基因表达和表观遗传的动态变化。首先,通过scRNA-seq鉴定了8种主要的细胞类型:间充质细胞、上皮细胞、血管内皮细胞、骨髓细胞、神经胶质细胞、肌源性前体细胞、神经元和肌细胞(图4A)。接着使用scRNA-seq的细胞注释的结果对scATAC-seq数据进行了注释,发现了相似的细胞类型分布模式(图4B)。此外,细胞类型特异性表达的标志物(图4C)在相应的亚群中也表现出相似的染色质可及性模式(图4D)。总之,这里使用了第一个研究思路,揭示了两组学的一致性。
接下来,作者进行了差异基因表达分析,然后通过计算染色质可及性与基因表达之间的Pearson相关系数来进行peak-基因关联分析。结果显示,有12,596个peak-基因对之间存在显著关联,其中12,596个peak与3787个细胞类型特异性基因显著相关(图5A)。然后,作者根据TF在RNA水平和ATAC水平的富集情况定义了细胞类型特异性TF,一共发现了8种主要细胞类型的81个推定标记物。以间充质细胞为例,
Twist2
和其结合位点MA0633.1的RNA表达和染色质可及性都显著富集,这表明
Twist2
是间充质细胞的潜在标记(图5B)。总之,这里使用了第二个研究思路,将染色质可及性与基因表达数据相关联,识别了与特定细胞类型相关的转录因子。
接下来,作者进一步评估了扰动特定转录因子对次级上颚发育的影响。应用CellOracle软件构建了转录因子调控网络,并模拟了特定调控因子缺失对细胞命运的影响。发现
SHOX2
和
MEOX2
分别反转了前次级腭和后次级腭的发育速度(图6AB)。对于
SHOX2
和
MEOX2
,CellOracle分别预测了11个和4个靶基因,在这些预测靶点中,
Satb
2
、
Prrx1
和
Prickle1
与腭裂(CP)有关(图6C)。随后,作者通过ChIP-seq实验验证了
MEOX2
与目标基因的相互作用。最后,为了验证预测的基因调控动力学,作者重新分析了
SHOX2
基因敲除小鼠前腭组织已发表的RNA-seq数据。发现受
SHOX2
正调控的基因在
SHOX2
敲除后表达降低,预测为负调控的基因在
SHOX2
敲除后表达增加(图6D)。这些结果表明
SHOX2
和
MEOX2
分别是驱动前次级腭和后次级腭发育的关键调控因子。总之,这里使用了第三和第四个研究思路,构建了转录因子调控网络,找到了核心调控因子,并用实验验证了其功能。
综上所述,scRNA-seq和scATAC-seq关联分析是高分文章中常用的多组学分析策略之一。通过两组学的联合应用,我们能够同时研究单个细胞的功能及其表观调控,从而更深入地理解细胞的异质性、动态变化和调控机制。
基迪奥在单细胞领域拥有丰富的项目经验,我们提供定制化的单细胞数据挖掘服务,可协助客户定制个性化的关联分析方案和发文策略,从多个方面深入挖掘数据,让您的文章更上一层楼。
[1] Alaterre E, Ovejero S, Bret C, et al. Integrative single-cell chromatin and transcriptome analysis of human plasma cell differentiation[J]. Blood Journal, 2024: blood. 2023023237.
[2] Yan F, Suzuki A, Iwaya C, et al. Single-cell multiomics decodes regulatory programs for mouse secondary palate development[J]. Nature communications, 2024, 15(1): 821.