癌症研究领域的大量工作集中在鉴定和验证能够成为治疗靶点的癌蛋白和非编码RNA上,然而,越来越多的新近研究观察表明,包括启动子、增强子、绝缘子和沉默子在内的能够调控基因组三维结构(3D基因组)进而调控转录景观的非编码顺式调控元件(noncoding cis-regulatory elements, NCREs)同样有望成为癌症治疗靶点。
2024年11月1日,北京大学冯嘉汶、李开龙、尹玉新和复旦大学卫功宏在Cancer Discovery 发表评论文章,以Targeting Noncoding cis-Regulatory Elements for Cancer Therapy in the Context of the 3D Genome为题。在这篇前瞻性评论中,研究团队设想在肿瘤组织的癌细胞和非恶性细胞中进一步破译非编码顺式调控密码、鉴定功能性非编码顺式调控元件和重复出现三维基因组改变的努力可能为癌症治疗新策略的开发铺平道路。
研究癌症如何产生以及如何治愈是一个漫长而复杂的过程。一些研究进展,包括在癌症早期诊断、新型手术方法、化学治疗、靶向治疗和免疫疗法的进展,已经使癌症成为一种在某些情况下可治愈的疾病。然而,由于复发、转移或对现有疗法产生耐药性,很大一部分癌症患者仍然要面对不可逆转的疾病进展。这些致命的疾病进展主要源于基因组不稳定性、突变或表观遗传重编程,这些改变最终可能都指向NCREs和3D基因组的功能性紊乱。
在三维基因组背景下,转录景观不仅由编码和非编码DNA的线性序列信息决定,3D基因组的组织结构层次也是决定性因素,这些3D结构包括染色质环(chromatin loops)、拓扑结构域(topologically associating domains, TADs)、染色体区室(chromosomal compartments)和染色质疆域(chromatin territories)【1】。NCREs大致可分为增强子、沉默子、启动子和绝缘子以及其他新发现的元件,如栓系元件。NCREs内的转录因子结合位点(transcription factor binding sites, TFBSs)也称为转录因子(transcription factors, TFs)基序(motif),是决定三维基因组结构的关键因素。TFBS被具有DNA结合结构域的蛋白质(主要包括经典的转录因子和CTCF等识别特异DNA基序的结构蛋白)识别,然后招募共激活因子和/或共抑制因子一起建立3D基因组结构【1】。这一过程受到精确调控,并以细胞类型特异的方式在空间、时间和表达量上指导转录。越来越多的证据表明,NCREs、TFs、结构蛋白、共激活因子、共抑制因子、非编码RNA和转录机器的协同作用建立了适当的三维基因组结构,这对维持细胞身份和指导细胞分化至关重要,而失调则会导致恶性转化等病理性结局【2】。目前破译癌症中的功能性NCREs和重复出现的三维基因组改变在技术上是可行的,这将有助于进一步了解细胞身份维持和细胞分化失调如何导致恶性转化。
福泰制药(Vertex Pharmaceuticals)和 CRISPR Therapeutics公司共同开发的一种靶向NCRE的基因编辑疗法exagamglogene autotemcel (exa-cel) 获得了临床使用批准【3】,为潜在的靶向NCRE的癌症治疗策略提供的示例。该疗法利用簇状规则间隔短回文重复序列(clustered regularly interspaced short palindromic repeats, CRISPR)-Cas9系统敲除BCL11A的一个增强子,用于治疗镰状细胞贫血和输血依赖性地中海贫血,这是临床—实验室—临床的医学研究闭环模式的高光时刻。由于癌症基因组和肿瘤组织的异质性和复杂性,癌症与单基因疾病的治疗策略之间仍存在显著的鸿沟。在这篇前瞻性评论中,我们设想全面在肿瘤组织的癌细胞和非恶性细胞中研究功能性NCREs和重复出现的三维基因组改变,将可能填补这些鸿沟,为制定相关的癌症治疗新策略提供线索。
在肿瘤中鉴定功能性NCREs
包括DNA元件百科全书(the Encyclopedia of DNA Elements,ENCODE)计划和表观遗传组学蓝图联盟(the Roadmap Epigenomics Mapping Consortium,通常简称Roadmap)计划在内的大型倡议性项目已注释了人类基因组中的数百万个候选NCREs。尽管非恶性细胞和组织中NCREs已经被广泛地进行研究【4, 5】,然而针对癌症的NCREs研究仍相对较少。想要系统全面地研究肿瘤组织中癌细胞和非恶性细胞的功能性NCREs,我们认为应该组合实验和计算方法,且这些组合方法应基于成熟或不断演进的在整体组织或细胞团(bulk)或单细胞(single-cell)水平的高通量测序、高通量超分辨率成像、大规模平行报告分析(massively parallel reporter assays, MPRAs)以及遗传或表观遗传编辑(Fig. 1A)。
最近的证据表明,癌细胞中的NCREs有望成为癌症治疗靶点。例如,一项研究表明,靶向NCREs可防止激素依赖性乳腺癌(hormone-dependent breast cancer, HDBC)在内分泌辅助治疗下复发【6】。在这项研究中,研究人员重点研究了包括增强子、启动子和绝缘子在内的NCREs,确定了与辅助治疗下适应过程相关的功能性NCREs。这项研究为今后在临床相关条件下鉴定癌细胞的功能性NCREs提供了研究范式,这将为认识癌细胞转移或逃逸现有疗法(包括化疗、内分泌疗法和免疫疗法)的机制提供新的见解。
肿瘤组织由相互联系的非恶性细胞和癌细胞组成。单模态和多模态的单细胞方法的迅速发展扩大了我们对肿瘤组织中不同类型细胞之间相互作用的了解,尤其是对肿瘤浸润淋巴细胞(tumor-infiltrating lymphocytes, TILs)、癌相关成纤维细胞(cancer-associated fibroblasts, CAFs)和癌细胞之间相互作用的了解。对这些相互作用的调节被认为是有前景的治疗策略,PD-1和PD-L1阻断剂在癌症免疫疗法中的成功应用就是例证。最近的一项研究报告了CD4+T细胞中被转录的增强子图谱【7】,为识别肿瘤组织中不同细胞类型的被转录的增强子或其他类型的NCREs提供了潜在路径。鉴于绝大多数NCREs是以种系特异性或细胞类型特异性的方式发挥其功能的,我们认为在肿瘤组织的非恶性细胞中鉴定NCREs将为在肿瘤微环境(tumor microenvironment, TME)中调控特定类型细胞的功能开辟新的途径。
揭示癌症中重复出现的三维基因组改变
三维基因组改变由NCREs内的非编码变异、染色质结构变异(SVs)和表观遗传重编程所引起(Fig. 1B),能够破坏染色质环、TADs、染色体区室或染色质疆域,这些改变现在被认为是多种癌症的关键特征和疾病进展驱动力。
重复出现的三维基因组改变可能是由在NCREs中重复出现的非编码变异引起的。全基因组泛癌分析(Pan-Cancer Analysis of Whole Genomes,PCAWG)联盟已经直面了鉴定重复出现的非编码变异的一些挑战,这些挑战源于来自癌症基因组的可用于分析的全基因组测序(whole-genome sequencing, WGS)数据数量有限,还源于统计模型对特定协变量(如TFBSs)的依赖【8】。越来越多的证据表明,许多与癌症相关的非编码变异并不会破坏已知的TFBS。最近的一个旨在直接根据DNA序列实现数千个增强子活性定量预测的深度学习模型DeepSTARR表明,TFBSs的基序侧翼序列以及TFBSs之间的间距对预测增强子的活性有很高的参考价值【9】,这表明要改进计算确定变异方法(variant-calling methods)还应该将基序侧翼序列等其他协变量纳入考虑。另一方面,前述的研究表明,鉴定功能性NCREs为癌症基因组提供更详细的注释,有助于改进计算确定重复出现的非编码变异的背景模型【6】。此外,CD4+T细胞被转录的增强子图谱系统地解释了一系列从大规模全基因组关联研究(GWAS)分析中得出的与免疫系统疾病相关的非编码变异【7】,这反映了通过在肿瘤组织不同细胞类型中鉴定功能性NCREs,有潜力在肿瘤微环境的非恶性细胞中发现非编码癌症驱动因素。我们预期,在各种类型的癌症中生成更多的WGS数据以及全面鉴定肿瘤组织中癌细胞和非恶性细胞的功能性NCREs,将为改进计算确定变异方法提供额外的协变量,进而促进重复出现的非编码变异的发现,从而发现重复出现的三维基因组改变。
重复的三维基因组改变也可能由结构变异(structural variants, SVs)引起【10, 11】。值得注意的结构变异包括PML–RARA融合基因、ERBB2基因扩增和BCR–ABL1融合基因,它们分别被全反式维甲酸、曲妥珠单抗和伊马替尼靶向抑制,这些研究发现标志着基因靶向治疗时代的开始。然而,直到全基因组测序(WGS)和基因组长读长测序技术在癌症研究领域得到广泛应用,SVs才得到了充分的研究。简单的SVs可能由易位、缺失、重复、倒位和插入引起。此外,染色体碎裂(chromothripsis)、断裂-融合-桥接(breakage-fusion-bridge, BFB)循环及染色体外环状DNA(extrachromosomal circular DNA, ecDNA)能够引起复杂的SVs【12】。SVs是基因扩增、基因缺失、增强子/沉默子劫持和TAD边界改变的常见原因,这导致了癌症基因组的遗传学多样性和癌细胞的适应性。已有研究表明,通过分析少于100个不同组织类型来源的癌症样本【11】或约30个组织类型独特的癌症样本【10】的Hi-C数据集,就可以揭示癌症基因组中由SVs引起的重复出现的三维基因组改变。基于这些发现,我们预期一个覆盖多种类型癌症的三维基因组图谱的生成将为我们在治疗前后的癌症疾病起始、维持和进展提供前所未有的认知视角。
除了非编码变异和结构变异(SVs),表观遗传重编程也会导致重复出现的三维基因组改变。最近发现的后颅窝室管膜瘤A型(posterior fossa group A, PFA)特异的重复出现的三维基因组改变,也被称为PFA中的B型超长距离相互作用(type B ultra long-range interactions in PFAs, TULIPs),为这种表观遗传重编程导致的三维基因组改变提供了示例【2】。PFA室管膜瘤是一种缺乏明确遗传学驱动因素的癌症。这项研究表明,所有PFA样本均呈现出TULIPs,而这种现象可以通过在人类神经祖细胞中过表达EZHIP诱导。这是个在特定类型癌症中揭示独特三维基因组改变特征的例子,并强调了在多种类型的癌症(尤其是在缺乏明确驱动突变的癌症)中,刻画三维基因组图谱的研究需求。
未来需要研究 PFA室管膜瘤由于TULIPs形成而产生的脆弱性,类似的,也需要在其他类型缺乏明确遗传驱动因素的癌症中研究由于相应重复出现的三维基因组改变而产生的脆弱性。这将有助于理解如何利用三维基因组特征开发新的癌症治疗策略。
功能性NCRE及其靶基因
识别NCREs的靶基因通常被认为是研究其在转录过程中的调节作用所必要的。然而,研究NCREs的转录输出仍然非常具有挑战性,因为一个NCRE可以作用于多个基因,而一个基因也可以被多个NCREs调控。不仅如此,NCREs与其靶基因之间的动态相互作用使得识别NCRE—基因对(NCRE-gene pairs)变得更加复杂。
最近的一项研究聚焦于一类可能参与超保守生物学过程的NCREs——超保守元件(ultraconserved elements, UCEs),研究了在携带BCR-ABL融合基因的慢性髓性白血病细胞中UCEs对伊马替尼耐药性的影响【13】。在这项研究中,研究人员试图通过整合单细胞捕获配对引导RNA(paired guide RNA)和单细胞RNA测序,系统地描述42个功能性NCREs的转录输出,并最终识别出22个显著的NCRE—基因对。然而,在这项研究中未能识别靶基因的其他20个功能性NCREs同样不应该被忽视,因为它们的功能也同样显著。如果未能识别靶基因的NCREs效果更显著,那么靶向具有特定靶基因的NCREs就不应该优先于未能识别靶基因的NCREs。此外,如该研究所示,敲除一个名为ZNF503_Ophelia的UCE导致其旁边的TAD中的SAMD8基因转录上调【13】,这表明NCREs及其相应的靶基因不一定同处一个TAD内。事实上,学界已经提出了这样的观点:染色质相互作用可能并不是NCREs调控其靶基因所必需的【1】。
基于以上观点,我们认为识别功能性NCREs应优先于识别NCRE—基因对,在某些情况下,识别NCRE-基因对可能是不必要和不可行的。
靶向功能性NCREs本身还是其靶基因
如前所述,目前一些功能性NCREs的靶基因仍受技术限制尚未能识别【13】,因此靶向这些NCREs的靶基因是不可行的。然而,当我们靶向具有特定靶标的功能性NCREs时,还需要回答一个基本问题:为什么我们应该靶向NCREs而不是它们的靶基因?
一个可能的答案是,NCREs的活性通常具有谱系特异性甚至细胞类型特异性(Fig. 1C,左侧)。靶向NCREs因此可以实现对某些类型细胞的功能或行为的调控,例如通过调控肿瘤组织中TILs和CAFs的活性来抑制癌症疾病进展。靶向NCRE的另一个显而易见的优势是避免严重不良反应的潜力。例如,靶向突变的PIK3CA癌蛋白是一种杀死携带PIK3CA突变癌细胞的有效策略,但同时抑制生理活动所必须的PIK3CA活性会引发严重不良反应,这限制了这个治疗策略的应用【14】。如果能够在癌细胞中识别出谱系特异性的靶向PIK3CA的功能性NCREs,那么靶向这些谱系特异性NCREs将可以避免对PIK3CA活性的广泛抑制,从而为癌症患者提供临床益处的同时减少不良反应。
另一个靶向NCRE而不是它们的靶基因的原因是,当一个功能性NCRE调控多个有效的靶基因时,靶向该NCRE等同于靶向多个有效基因(Fig. 1C,右侧)。这个原因与靶向ecDNA上的NCREs尤其相关。虽然染色质上的NCREs调控的靶基因通常数量有限,但ecDNA上的NCREs的靶基因似乎是无法计算的,因为ecDNA通过与其他ecDNA分子以及与人类癌症基因组的全部23条染色体均发生相互作用【15】。此外,由于ecDNA分子的遗传异质性即便在单一类型的癌细胞中也会存在【15】,这使得通过表观编辑ecDNA上的NCREs的效果可能难以预测。然而,对ecDNA上的NCRE进行表观编辑所能带来的潜在益处非常显著,值得呼吁对此进行研究。
我们期待开发一种特异性靶向ecDNA并对此进行完全编辑的新工具。该工具可以通过靶向ecDNA的连接位点来避免错配靶向染色体DNA,并能从靶位点广泛传播表观遗传信号,从而实现整个ecDNA分子的完整编辑,或者可以通过DNA内切酶在靶位点进行切割并通过DNA外切酶活性实现整个ecDNA分子的消化去除。这样的进展将会大大地提高我们高效靶向NCRE的能力,并可能实现更精确和有效的癌症治疗。
未来展望
系统和全面的癌症图谱正在不断拓展我们对这种复杂且致命疾病的认识。然而,癌症如何产生以及如何治愈仍然是一个未解的谜团。PCAWG联盟系统且广泛地描述了各种癌症类型的遗传、表观遗传和转录组景观。ENCODE、Roadmap计划以及正在进行中的人类生物分子图谱计划(Human BioMolecular Atlas Program, HuBMAP)在进一步表征癌症中的表观遗传重编程方面也取得了实质性进展。
我们认为下一步应该针对各种类型癌症的肿瘤微环境中的癌细胞以及非恶性细胞,描绘一幅它们的功能性NCREs和重复出现的三维基因组改变的系统性图谱。这些系统性的研究将有助于鉴定非编码癌症驱动因子,揭示由重复出现的三维基因组改变引发的脆弱性,并鉴定出TILs和CAFs的关键调节因子。这个系统性图谱最终将为我们提供前所未有的见解,如何在三维基因组背景下解释癌细胞的转移、免疫监视逃逸以及对现有疗法产生耐药性。我们预计通过靶向谱系特异性或细胞类型特异性的NCREs可以实现杀死癌细胞或调节TILs和CAFs的功能,这些新策略将展现出更好的临床疗效和更少的不良反应,由此实现对癌症治疗策略的革新。
图例:
图1:A. 在肿瘤中鉴定功能性NCREs;B. 癌症中重复出现的三维基因组改变;C. 靶向功能性NCREs本身而不是它们的靶基因的可能原因。HSR, homogenously staining region,均质染色区;BFB, breakage-fusion-bridge,断裂-融合-桥接;DSB, double-strand break,双链断裂;EZHIP, EZH inhibitory protein,EZH抑制蛋白;MPRA, massively parallel reporter assays,大规模平行报告分析。(A-C均借助Biorender.com创作)
原文链接:
https://doi.org/10.1158/2159-8290.CD-24-0836
制版人:十一
1. Kim S, Wysocka J. Deciphering the multi-scale, quantitative cis-regulatory code. Mol Cell 2023;83(3):373-92 doi 10.1016/j.molcel.2022.12.032.
2. Johnston MJ, Lee JJY, Hu B, Nikolic A, Hasheminasabgorji E, Baguette A, et al. TULIPs decorate the three-dimensional genome of PFA ependymoma. Cell 2024 doi 10.1016/j.cell.2024.06.023.
3. Daley GQ. Welcoming the Era of Gene Editing in Medicine. N Engl J Med 2024;390(18):1642-5 doi 10.1056/NEJMp2314279.
4. Przybyla L, Gilbert LA. A new era in functional genomics screens. Nat Rev Genet 2022;23(2):89-103 doi 10.1038/s41576-021-00409-w.
5. Preissl S, Gaulton KJ, Ren B. Characterizing cis-regulatory elements using single-cell epigenomics. Nat Rev Genet 2023;24(1):21-43 doi 10.1038/s41576-022-00509-1.
6. Barozzi I, Slaven N, Canale E, Lopes R, Amorim Monteiro Barbosa I, Bleu M, et al. A functional survey of the regulatory landscape of estrogen-receptor-positive breast cancer evolution. Cancer Discov 2024 doi 10.1158/2159-8290.CD-23-1157.
7. Oguchi A, Suzuki A, Komatsu S, Yoshitomi H, Bhagat S, Son R, et al. An atlas of transcribed enhancers across helper T cell diversity for decoding human diseases. Science 2024;385(6704):eadd8394 doi 10.1126/science.add8394.
8. Elliott K, Larsson E. Non-coding driver mutations in human cancer. Nat Rev Cancer 2021;21(8):500-9 doi 10.1038/s41568-021-00371-z.
9. de Almeida BP, Reiter F, Pagani M, Stark A. DeepSTARR predicts enhancer activity from DNA sequence and enables the de novo design of synthetic enhancers. Nat Genet 2022;54(5):613-24 doi 10.1038/s41588-022-01048-5.
10. Xu J, Song F, Lyu H, Kobayashi M, Zhang B, Zhao Z, et al. Subtype-specific 3D genome alteration in acute myeloid leukaemia. Nature 2022;611(7935):387-98 doi 10.1038/s41586-022-05365-x.
11. Xu Z, Lee DS, Chandran S, Le VT, Bump R, Yasis J, et al. Structural variants drive context-dependent oncogene activation in cancer. Nature 2022;612(7940):564-72 doi 10.1038/s41586-022-05504-4.
12. Dubois F, Sidiropoulos N, Weischenfeldt J, Beroukhim R. Structural variations in cancer and the 3D genome. Nat Rev Cancer 2022;22(9):533-46 doi 10.1038/s41568-022-00488-9.
13. Li Y, Tan M, Akkari-Henic A, Zhang L, Kip M, Sun S, et al. Genome-wide Cas9-mediated screening of essential non-coding regulatory elements via libraries of paired single-guide RNAs. Nat Biomed Eng 2024 doi 10.1038/s41551-024-01204-8.
14. Browne IM, Andre F, Chandarlapaty S, Carey LA, Turner NC. Optimal targeting of PI3K-AKT and mTOR in advanced oestrogen receptor-positive breast cancer. Lancet Oncol 2024;25(4):e139-e51 doi 10.1016/S1470-2045(23)00676-9.
15. Yan X, Mischel P, Chang H. Extrachromosomal DNA in cancer. Nat Rev Cancer 2024;24(4):261-73 doi 10.1038/s41568-024-00669-8.
(可上下滑动阅览)
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。