在浩瀚无垠的人体微观世界中,基因犹如精密的指令代码,掌控着生命的万千奥秘。而在基因调控的神秘舞台上,CTCF 宛如一位忠诚的 “边界卫士”,默默守护着基因表达的正常秩序。你是否曾好奇,在胃肠道间质瘤(GIST)的发生发展进程中,CTCF 是怎样履行其职责的?它所界定的拓扑边界究竟隐藏着怎样的秘密,竟能左右癌基因的活性?今天,就让我们一同走进这微观世界,揭开 CTCF 作为TAD边界调控增强子 - 癌基因的神秘面纱。
2024 年 4 月 4 日,发表于Molecular Cell的 “Dissection of a CTCF topological boundary uncovers principles of enhancer-oncogene regulation” 一文,深入探究了胃肠道间质瘤(GIST)中CTCF边界元件破坏导致癌基因表达的分子机制,为相关研究提供了重要参考。本文将对该研究进行详细解读,剖析其关键发现与意义。
扫码添加 ⬪ 精彩内容抢先看
个性解读|课题设计
生信热点|直播分享
基因调控是细胞身份的关键驱动因素,增强子在其中发挥着重要作用。人类基因组中众多的增强子如何精准调控基因表达,以及它们如何与远距离的基因靶点相互作用,仍是未解之谜。染色体构象(“拓扑”)及增强子与启动子间的物理接触在基因调控中的作用备受关注。染色体构象捕获技术,如 Hi-C 和微球菌核酸酶消化结合的micro-C技术,揭示了基因组被划分为拓扑相关结构域(TADs),其边界常由CTCF绝缘子界定。然而,TADs 的功能及增强子 - 启动子相互作用的机制仍存在争议。
人类遗传学和疾病研究表明,TADs 和边界的异常与多种疾病相关。在 GIST 中,部分由琥珀酸脱氢酶(SDH)复合物缺失驱动,伴有 DNA 高甲基化,导致 CTCF 结合位点破坏,影响边界功能。此前研究发现,特定 CTCF 绝缘子的破坏会使增强子异常激活癌基因,但对于具体的调控机制仍需深入探究。
(一)FGF3 - FGF4 位点的拓扑组织和调控景观
为研究位点拓扑对 FGF3 和 FGF4 原癌基因转录的影响,研究者运用region-capture micro-C(RCMC)技术,绘制了 GIST - T1 细胞中该位点的 1kb 分辨率接触图谱(图 1A)。该图谱显示,FGF 基因位于约 200kb 的 TAD 内,相邻 TAD 包含 ANO1 及其增强子。两个 TAD 间由边界 TB2 隔开,TB2 包含四个强结合的 CTCF 位点,其基序方向具有重要意义。
图1
通过比较 SDH 缺陷型和正常型 GIST 样本,发现 SDH 缺陷型中 CTCF 结合减少,与先前研究一致。对 ANO1 所在TAD 中的两个增强子研究表明,它们在所有 GIST 亚型中均转录增强子RNA(eRNA),提示其活性较强。在 SDH 缺陷型肿瘤中,近端增强子(eRNA - 1)与 FGF3/FGF4 表达高度相关,而远端增强子(eRNA - 2)则相反。这表明在 TB2 缺失的情况下,近端增强子可能与 FGF3 和 FGF4 的激活有关。
对 eRNA - 1 在胃肠道组织中的单细胞 RNA 测序数据分析发现,其在间质细胞(ICC)中高表达,提示 TB2 的破坏可能导致近端增强子激活 FGF 癌基因,ICC 可能是 GIST 的起源细胞。
(二)CTCF 组合式位点破坏的实验模型
研究者利用 CRISPR - Cas9 编辑技术,在 GIST - T1 细胞系中对 TB2 区域的 CTCF 位点进行不同组合的破坏,以验证 TB2 的绝缘功能并确定关键 CTCF 位点。实验设计了 8 种 GIST - T1 细胞衍生物,通过实时定量 PCR 检测发现,其中 5 种衍生物(DInsD/E/F/G/H)中 FGF3 表达显著上调,这 5 种衍生物的共同特点是 TB2 中的四个 CTCF 结合位点均被破坏(图 2A、2B)。而 FGF4 在任何细胞系衍生物中均未被强烈诱导,表明其转录可能受其他因素影响。
图2
RNA 测序分析显示,在 4 种响应性衍生物中,尽管 FGF3 被强烈诱导,但未发现其他显著受 TB2 破坏调控的基因。在这些衍生物中,ANO1 和 eRNA - 2 表达略有下调,而 eRNA - 1 和其他转录本保持稳定(图 2C、2D)。
染色质免疫沉淀测序(ChIP - seq)分析表明,在未编辑的 GIST - T1 细胞中,FGF 所在TAD 缺乏激活的 H3K27ac 染色质,而富含抑制性的 H3K27me3 修饰;ANO1 TAD 则相反。在组合式 CTCF 缺失且 FGF3 表达的衍生物中,FGF3 启动子上的 H3K27ac 显著增加,H3K27me3 水平降低,且 H3K27ac 增加程度与 FGF3 诱导程度密切相关(图 2E、2F)。这些结果表明,特定组合的 CTCF 位点对 TB2 的绝缘功能至关重要,且边界破坏后会引起转录和乙酰化变化,提示增强子 - 启动子可能发生异常相互作用。
(三)高分辨率接触图谱揭示 CTCF 依赖的拓扑环
通过对 GIST - T1 细胞系的高分辨率 RCMC 接触图谱分析,发现相邻的 FGF 和 ANO1 TADs 之间存在由 CTCF 位点介导的长距离接触,形成环域结构(图 3A)。在未编辑的 GIST - T1 细胞中,FGF 和 ANO1 TADs 之间的物理相互作用极少。
图3
对 GIST - T1 衍生物的 RCMC 分析显示,尽管位点整体拓扑基本保持完整,但 TB2 的绝缘强度在所有衍生物中均降低。通过计算绝缘分数和比较成对接触频率,发现 TB2 元素内的相互作用减少,而 FGF TAD 和 ANO1 TAD 之间的 “跨 TAD” 相互作用增加,但不同衍生物中的变化幅度和模式存在差异(图 3B - D)。这表明位点拓扑的变化可能是导致 FGF3 转录水平不同的原因之一。
(四)FGF3 与 eRNA - 1 起始位点间的接触频率预测 FGF3 诱导
计算对照细胞和衍生物之间的差异接触图谱,发现 TB2 破坏后,eRNA - 1 增强子与 FGF3 启动子之间的相互作用增加,而与 ANO1 TAD 内的多个位点的相互作用减少(图 4A)。通过从 RCMC 数据中推断 “4C” 图谱,进一步证实了 eRNA - 1 与 FGF3 启动子之间的特异性相互作用,且相互作用峰值位于两者的转录起始位点(图 4B)。
图4
基于此,研究者假设 eRNA - 1 和 FGF3 启动子之间的物理相互作用驱动 FGF3 转录诱导。通过计算两者转录起始位点间的接触频率,并与 FGF3 RNA 表达进行相关性分析,发现以 5kb 窗口计算时,接触频率与 FGF3 表达呈非线性相关;而以 1kb 窗口直接计算转录起始位点间的接触频率时,两者呈显著线性相关(r = 0.97,p < 0.01)(图 4C、4D)。这表明 FGF3 表达受与 eRNA - 1 增强子相互作用的精确调控,支持了增强子 - 启动子接触直接激活癌基因的模型。
(一)边界元件的冗余性
本研究发现 FGF 边界元件通过冗余的 CTCF 位点实现稳健性。TB2 中的多个 CTCF 位点可确保相邻 TADs 的边界功能,防止增强子 “劫持” 原癌基因。即使单个 CTCF 位点也足以维持绝缘功能,这与通过黏连蛋白介导的环挤压模型一致,即单个 CTCF 位点可阻止增强子与启动子的共定位,从而防止异常转录激活。
(二)边界破坏与转录激活的关系
通过对 GIST - T1 衍生物的高分辨率接触图谱分析,发现尽管边界破坏后 FGF3 转录被诱导,但 TADs 仍部分保留。不同组合的 CTCF 破坏导致不同的构象变化,而增强子与 FGF3 启动子之间的接触频率与 FGF3 诱导程度呈线性相关,且这种相关性在精确聚焦于转录起始位点间的 1kb 区间时最为显著。这支持了转录激活直接由增强子与启动子转录复合物间的物理接触驱动的模型,表明 TAD 组织的微小变化若能增加增强子 - 启动子的物理接触,即可导致基因强烈诱导。
(三)对疾病机制的见解
研究确定了一个特定增强子在 SDH 缺陷型 GIST 中驱动 FGF 异常表达,其相关 eRNA 在 ICC 中高表达,提示 ICC 可能是 GIST 的起源细胞。在生理条件下,该边界可阻止增强子影响 FGF 基因,但在 SDH 缺陷型 GIST 中,DNA 高甲基化破坏了边界,导致 FGF 诱导和肿瘤发生。此边界元件的调控作用具有高度的上下文依赖性,可能仅在 GIST、ICC 或特定表达 ANO1 的神经细胞类型中显著。
(四)研究局限性
尽管研究取得了重要发现,但仍存在一些局限性。例如,CTCF 扰动仅特异性激活 FGF3,而 FGF4 未被激活,其原因尚不完全清楚。此外,RCMC 技术提供的是静态、平均的测量结果,无法追踪动态过程,如环挤压的时间变化以及增强子 - 启动子接触与转录的时间关系。未来研究需要解决这些问题,以更全面地理解基因组调控机制。
本研究深入剖析了一个独特的拓扑边界元件,揭示了其对 FGF 配体基因的绝缘作用及其在 GIST 中的重要性。研究结果表明,冗余的 CTCF 位点确保了边界的稳健性,边界破坏后增强子 - 启动子的接触频率与 FGF3 转录激活呈线性相关,为长距离转录激活的机制提供了有力证据。这不仅加深了对基因组拓扑结构和基因调控关系的理解,也为 GIST 等疾病的发病机制研究提供了新的视角,有望为相关疾病的治疗策略开发提供理论依据。
扫码添加 ⬪ 精彩内容抢先看
个性解读|课题设计
生信热点|直播分享