专栏名称: 生信菜鸟团

生信菜鸟团荣誉归来，让所有想分析生物信息学数据的小伙伴找到归属，你值得拥有！

Nature ecDNA 系列 | 癌细胞中 ecDNA 的协调遗传

生信菜鸟团 · 公众号 · 生物 · 2024-12-05 06:27

正文

前言：

Nature 8037 期有一系列关于 ecDNA 研究的文章。
Extrachromosomal DNA：ecDNA。
链接：综述精读 | 癌细胞中的染色体外DNA
链接： Nature | 10万基因组项目的14,778名患者的39种肿瘤类型ecDNA的研究
链接： Nature ecDNA 系列 | ecDNA 如何促进癌症的进化

Basic Information

英文标题：Coordinated inheritance of extrachromosomal DNAs in cancer cells
中文标题：癌症细胞中外染色体DNA的协调遗传
发表日期：06 November 2024
文章类型：Article
所属期刊：Nature
文章作者：King L. Hung | Howard Y. Chang
文章链接：https://www.nature.com/articles/s41586-024-07861-8

Abstract

Para_01

遗传的染色体理论规定，同一染色体上的基因共同分离，而不同染色体上的基因则独立分配。
细胞外DNA（ecDNA）在癌症中很常见，通过细胞分裂期间的随机分离驱动癌基因扩增、基因表达失调和肿瘤内异质性。
不同的ecDNA序列，称为ecDNA物种，可以共存以促进癌细胞中的分子间合作。
肿瘤细胞中多个ecDNA物种如何在体细胞世代中分配和维持尚不清楚。
在这里，我们显示合作的ecDNA物种通过有丝分裂共分离而协调遗传。
成像和单细胞分析显示，编码不同癌基因的多个ecDNA在人类癌细胞中共存且拷贝数相关。
在有丝分裂过程中，ecDNA物种协调不对称分离，导致子细胞在选择前同时获得多个ecDNA物种的拷贝数增加。
有丝分裂开始时的分子间接近性和活跃转录促进了ecDNA物种的协调分离，而转录抑制减少了共分离。
计算建模揭示了ecDNA共分离和共选择的定量原则，预测了它们在癌细胞中的观察分布。
ecDNA的协调遗传使含有仅增强子元件的特化ecDNA的共扩增成为可能，并指导联合耗竭合作ecDNA癌基因的治疗策略。
ecDNA的协调遗传赋予癌基因合作和新型基因调控回路的稳定性，使获胜的表观遗传状态组合能够在细胞世代中传递。

Main

Para_01

癌基因扩增通过增加编码癌基因产物的遗传序列拷贝数来驱动癌症发展。
癌基因经常在兆碱基大小的环状 ecDNA 上扩增，这在一半的人类癌症类型中被检测到。
首次报道于1965年，ecDNA扩增（也称为双分钟）已被证明通过驱动拷贝数异质性和癌症对选择压力的快速适应来促进癌症发展。
这种异质性和适应性可以归因于这样一个事实：尽管ecDNA在每个细胞周期中复制并在细胞分裂过程中传递，但由于缺乏着丝粒，ecDNA分子在有丝分裂期间不均匀地遗传给子细胞。

Para_02

ecDNA 展现出显著的遗传序列多样性。
首先，多个源自不同染色体位点的 ecDNA 可以在同一癌细胞中共存，通常聚集在核内的微米级中心，这些中心能够促进不同 ecDNA 之间的分子间基因激活。
其次，ecDNA 包含聚类的体细胞突变，这表明 APOBEC3 介导的突变，增加了 ecDNA 序列和功能的多样性。
第三，ecDNA 可以包含来自各种基因组位点的复杂结构重排。
DNA 损伤可以使 ecDNA 聚集，并有时将其纳入微核，其中 DNA 可进一步片段化和重组。
这些重排事件可以导致细胞群体中存在多样化的共存 ecDNA 类型，包括具有不同致癌基因位点的 ecDNA 或仅包含增强子或致癌基因编码序列的 ecDNA。

Para_03

观察到在同一细胞中存在多种不同的 ecDNA 物种，含有不同的致癌基因，这表明 ecDNA 可能代表了专门化的、合作的分子。
例如，据报道，在 ecDNA 携带的癌症复发或药物治疗后，细胞中可以形成新的 ecDNA 物种，而原始的 ecDNA 扩增子仍然保留，这表明多个 ecDNA 物种可能独立产生，并且它们的相互作用为癌细胞提供了适应优势。
同样，携带致癌基因和非编码调控元件的 ecDNA 可以以组合方式与彼此和染色体相互作用，以促进基因表达。
这些观察结果支持了这样一个假设：即在同一细胞中存在多种 ecDNA 序列可能对转录程序具有组合和协同效应。

Para_04

ecDNA 遗传序列的多样性和癌细胞群体中 ecDNA 分子间相互作用的重要性引发了以下几个问题：(1) 多样化的 ecDNA 种类在细胞群体中是如何分布的；(2) 由于 ecDNA 在有丝分裂过程中不均等分离，这些 ecDNA 混合物是如何被子细胞继承的；(3) 多种 ecDNA 种类的动力学如何在选择压力下影响癌症的进化。
通过结合图像分析、单细胞和批量测序以及计算建模，我们着手阐明癌症中 ecDNA 共同进化的原理和后果。

Distinct ecDNAs co-occur in cancer cells

Para_01

为了研究具有不同序列的 ecDNA 分子在同一肿瘤中共存的频率，我们首先分析了从癌症基因组图谱（TCGA；方法）中的全基因组测序（WGS）数据预测的 ecDNA 结构。
这一分析显示，在 1,513 名患者的肿瘤中，有 289 个含有 ecDNA，携带已知致癌基因（如 EGFR、MDM2 和 CDK4）的编码序列（图 1a，b）。
在含有 ecDNA 的肿瘤中，超过 25%（81 个样本）在同一肿瘤中包含两种或多种 ecDNA 类型（图 1a 和扩展数据图 1a）。
许多这些 ecDNA 类型高度扩增，并包含典型的致癌基因（图 1b），支持了在同一肿瘤中可以找到异质的 ecDNA 序列的观点，它们的共存可能提供不同的选择优势（例如，胶质母细胞瘤样本中的 CCND2、EGFR 和 MDM4，以及尿路上皮膀胱癌样本中的 MYC 和 KRAS；扩展数据图 1b）。
由于我们仅将高度丰富且基因组不重叠的 ecDNA 序列视为不同的物种，因此这项分析可能低估了 ecDNA 物种的真实多样性。

Fig. 1: ecDNA species encoding distinct oncogene sequences are correlated in individual cancer cells.

a，TCGA 肿瘤样本中 ecDNA 阳性肿瘤的总结（左）和识别出的 ecDNA 物种数量（右）。

b，在 TCGA 肿瘤中识别出多个 ecDNA 物种的不同 ecDNA 物种的中位拷贝数和致癌基因状态。

c，已知 ecDNA 上有致癌基因序列的细胞系面板。

d，使用三种正交方法进行 ecDNA 分析的示意图：中期分裂期扩散、scATAC-seq 和 scCircle-seq。

e，使用针对各种致癌基因序列的 FISH 探针的中期分裂期扩散的代表性 DNA-FISH 图像。n = 64（TR14），n = 76（SNU16m1），n = 62（GBM39-KT），n = 70（CA718）和 n = 82（H716）细胞。比例尺，10 µm。

f，TR14 细胞中致癌基因对的拷贝数散点图和直方图。统计分析使用双侧 Spearman 相关性。

g，scATAC-seq 数据的均匀流形近似和投影（UMAP）分析，显示细胞系注释和指示致癌基因的拷贝数（CN）计算。

h，指示细胞系中致癌基因对之间的对数转换后的致癌基因拷贝数（Pearson’s R，双侧检验；所有相关性的 P < 2.2 × 10−16）。

i，同一 ecDNA 上的基因对（上）、两个 ecDNA 之间（中）和两个染色体之间（下）的 Pearson 相关系数热图。

j，COLO 320DM、SNU16、SNU16m1、TR14 和 GBM39-KT 细胞中同一 ecDNA 上的基因对（n = 4 基因对）、两个 ecDNA 之间（n = 8 基因对）和两个染色体之间（n = 42 基因对）的 Pearson 相关系数。

Para_02

肿瘤中不同 ecDNA 物种的频繁共扩增提出了一个问题：多个 ecDNA 物种是否可以在同一细胞中共存。
我们检查了一组先前被确定含有多种 ecDNA 物种的癌症细胞系和神经球模型（图 1c）。
在使用 DNA 荧光原位杂交（FISH）分析中期染色体扩散验证每个细胞系后（图 1d，e），我们发现绝大多数单个细胞在中期染色体扩散上的不同致癌基因的 FISH 信号重叠非常少（范围从 2% 到 7%；图 1e 和扩展数据图 2a–i）。
这些数据证实了不同的 ecDNA 并不是共价连接在同一 ecDNA 分子上，因此在分裂的癌细胞中它们是独立遗传的。

Para_03

我们接下来使用三种正交方法（图1d）研究了单细胞中ecDNA拷贝数的分布：(1) 通过DNA-FISH进行中期染色体扩散；(2) 分离单核并进行基于液滴的单细胞转座酶可及染色质测序（scATAC-seq）和RNA测序（RNA-seq）；以及 (3) 通过外切核酸酶消化和滚环扩增对单个细胞中的ecDNA进行富集和测序（scCircle-seq；方法）。
值得注意的是，在具有不同ecDNA种类的细胞系中，FISH成像显示成对的ecDNA种类的拷贝数显著相关（Spearman相关系数R = 0.24–0.52，所有情况下的P < 0.05；图1f和扩展数据图2j–n）。
接下来，我们通过改编scATAC-seq数据中的基因组背景覆盖率的拷贝数量化方法，评估了这些相关性在一个由71,804个细胞组成的较大群体中的显著性（图1d,g，方法和扩展数据图3a）。
值得注意的是，我们在每个具有多种ecDNA种类的三个细胞系中观察到不同ecDNA种类之间的正相关关系（图1h–j和扩展数据图3b,c；Pearson相关系数，R = 0.26–0.46，所有情况下的P < 1 × 10−15）。
正如预期的那样，共价连接在同一ecDNA分子上的基因序列（通过CRISPR–CATCH18从相同分子大小的分数中分离出来；扩展数据图3d）在这项分析中显示出强烈的拷贝数相关性，验证了这种方法用于测量细胞群体中ecDNA分子分布的有效性（图1i,j和扩展数据图3b,c）。
ecDNA拷贝数与相应扩增的癌基因的RNA表达呈正相关，支持了ecDNA种类的拷贝驱动转录结果的观点（扩展数据图3e）。
重要的是，我们没有观察到位于不同染色体上的基因对之间的拷贝数相关性，表明不同ecDNA种类之间的这种关系不能简单地用测序质量来解释（图1i,j和扩展数据图3b,c）。
最后，单细胞Circle-seq证实了MYCN、MDM2和CDK4 ecDNA种类在单个TR14神经母细胞瘤细胞中的共富集（扩展数据图3f）。

Para_04

为了研究具有不同致癌基因拷贝数的患者肿瘤是否在单细胞中表现出类似的拷贝数相关性特征，我们从公开的三阴性乳腺癌、高级别浆液性卵巢癌和胶质母细胞瘤的单细胞 ATAC-seq 或单细胞 DNA-seq 数据中整理了一个包含 41 个肿瘤样本的数据集。
我们设计了一种统计方法来识别使用单细胞拷贝数谱的局灶性扩增，并验证了我们在特征明确的细胞系中识别 ecDNA 扩增的能力（方法和扩展数据图 4a）。
将这种方法应用于患者肿瘤，我们发现 41 个病例中有 15 个（37%）具有与 ecDNA 特征匹配的局灶性扩增。
我们进一步预测了 7 个病例（占所有样本的 17%），这些病例在单细胞中具有两个或多个致癌基因的局灶性扩增，且拷贝数显著相关，提示存在共扩增的不同 ecDNA 物种（扩展数据图 4b,c）。

Para_05

这些结果共同表明，在癌细胞系和患者样本中，不同的 ecDNA 物种倾向于以相关拷贝数共存，远超随机预期。

Distinct ecDNA species co-segregate

Para_01

原则上，我们观察到的两种不同 ecDNA 物种的共现和相关性可能是由于（1）细胞亚群中 ecDNA 的过度复制；（2）两种物种的共同选择，前提是这两种物种提供了适应优势和/或参与了协同的分子间相互作用；或（3）两种物种在细胞分裂过程中共同分离到子细胞中。
为了调查过度复制是否对观察到的 ecDNA 相关性有贡献，我们使用单细胞多组学数据（方法）评估了细胞周期不同阶段的拷贝数相关性。
我们观察到，在已经复制了 DNA 的细胞中，ecDNA 没有额外的富集（扩展数据图 5a-c），这与先前文献报道的 ecDNA 在 S 期与基因组 DNA 一起每细胞周期复制一次是一致的。
相反，由于不同的 ecDNA 物种可以携带不同的致癌基因，且混合的 ecDNA 可以相互作用以增加基因表达，因此共同选择可以合理地解释 ecDNA 物种的共现。
然而，鉴于它们在子细胞中的随机分离，尚不清楚 ecDNA 物种及其协同相互作用如何在连续的细胞分裂中得以保留（图 2a）。

Fig. 2: Distinct ecDNA species are co-segregated into daughter cells during mitosis.

a, 单个 ecDNA 物种被随机遗传给子细胞，但它们的共同遗传尚不清楚。

b, 通过 Aurora 激酶 B (Aurora B) 的免疫荧光鉴定正在进行有丝分裂的子细胞对。使用序列特异性 FISH 探针定量单个 ecDNA。

c, 正在进行有丝分裂的 SNU16m1 子细胞对的代表性图像。n = 164 个细胞。比例尺，5 µm。

d, 癌症细胞系子细胞中的每个细胞 ecDNA 含量（双侧 Pearson’s R；SNU16m1，P < 2.2 × 10−16；TR14，P = 1.6 × 10−5；GBM39-KT，P = 1.8 × 10−7；H716，P < 2.2 × 10−16；CA718，P = 1.1 × 10−5）。H716 和 CA718 经过 3.5 小时的 DMSO 处理。误差带表示 95% 的置信区间。

e, 代表性图像显示了用 10 µM 雷公藤内酯醇处理 3.5 小时的 SNU16m1 细胞（n = 206 个细胞对）或 DMSO 对照处理 3.5 小时的 SNU16m1 细胞（n = 177 个细胞对）的 Aurora 激酶 B 蛋白和活性 RNA 聚合酶 II 的丝裂原激活蛋白激酶 2 位点磷酸化（pSer2 RNAPII）以及 FGFR2 和 MYC ecDNA 的免疫荧光-DNA-FISH 染色。白色虚线表示核边界。比例尺，10 µm。

f, 在 DMSO（对照组）和雷公藤内酯醇（10 µM）处理 3.5 小时后，癌症细胞系中 ecDNA 物种的共分离（Pearson’s R）。P 值是使用单侧 Fisher’s z 转换计算的，对于单个细胞系和所有细胞系的配对 t 检验也是如此。

g, 代表性图像显示了在 MYC 放大在 ecDNA 上的细胞系（PC3、COLO 320DM）、染色体上（COLO 320HSR）或没有 MYC 放大的细胞系（HCT116）中检测 MYC 内含子 2 作为新生转录的读数的内含子 RNA-FISH 图像。n = 37（PC3），n = 37（COLO 320DM），n = 19（用 RNase A 处理的 COLO 320DM），n = 41（COLO 320HSR）和 n = 38（HCT116）细胞。RNase A 处理的阴性对照显示内含子 RNA-FISH 信号消失。黄色箭头指示具有浓缩染色质的有丝分裂细胞。比例尺，10 µm。

Para_02

为了回答这个问题，我们评估了单个细胞分裂过程中多种 ecDNA 物种的分布。
使用 DNA-FISH 结合 Aurora 激酶 B 的免疫荧光染色（Aurora 激酶 B 是有丝分裂中期体的成分），我们量化了进行有丝分裂的子细胞对继承的 ecDNA 副本数量（图 2b）。
值得注意的是，在所有五个含有多种不同 ecDNA 物种的癌细胞系中（图 1c、e 和扩展数据图 2），我们观察到不同的 ecDNA 物种在子细胞中的显著共分离，这通过继承的 ecDNA 比例的相关性来测量（R = 0.4-0.71，每种情况下 P < 1 × 10−4；图 2c、d，方法和扩展数据图 5d）。
换句话说，继承更多 ecDNA 物种 1 副本的子细胞也倾向于继承更多 ecDNA 物种 2 的副本，反之亦然。
模拟 ecDNA 分离显示，子细胞中 ecDNA 物种的相关性远大于随机分离所预期的水平，或由罕见的 ecDNA 共价融合导致的共继承水平，并且与 ecDNA 共分离的水平呈线性关系（方法和扩展数据图 5e-g）。
由于 ecDNA 通过与有丝分裂染色体共定位而不是通过扩散来分离，因此这一结果不太可能由细胞体积差异驱动4,13,40。
总之，这些数据表明，虽然单个 ecDNA 遵循二项分布分离到子细胞中，但 ecDNA 物种的集合可能在有丝分裂期间共分离。

Transcription promotes co-segregation

Para_01

我们接下来研究了 ecDNA 共分离的分子机制。
先前的研究表明，ecDNA 在人工诱导的 DNA 损伤下聚集；最近的报告表明，受损的 DNA 片段在有丝分裂过程中通过 CIP2A-TOPBP1 复合体连接在一起并共分离。
然而，CIP2A 定位于 DNA 断裂处，并不与完整的 ecDNA 结合。
与该报告一致，我们发现 CIP2A 的基因敲除对 ecDNA 物种的共分离没有显著影响。

Para_02

正如我们和其他人先前报道的那样，在间期时，不同类型的ecDNA通过在转录活性位点的分子间接触相互作用形成ecDNA枢纽4,15，我们研究了它们的共分离是否与细胞核内的分子间接近有关。
为了使用活细胞成像技术在有丝分裂期间观察ecDNA枢纽，我们使用了结直肠癌COLO 320DM细胞系，该细胞系在MYC ecDNA中插入了四环素操纵子（TetO）阵列，并使用TetR-mNeonGreen对ecDNA分子进行荧光标记（方法）。
我们观察到，在许多情况下，ecDNA分子的枢纽在整个有丝分裂过程中保持为一个整体，许多ecDNA分子共分离进入同一个子代细胞核（扩展数据图6a）。
G2期的ecDNA簇在细胞进入有丝分裂时仍保持空间接近，附着在凝聚的染色体上，因此作为一个整体共分离进入同一个子代细胞核（扩展数据图6b）。
此前的研究表明，抑制溴结构域和末端结构域（BET）蛋白家族可以减少ecDNA的聚集4；尽管BRD4降解后ecDNA共分离水平呈下降趋势（方法），但这种效应并不显著，可能是由于降解不完全和BET蛋白家族其他成员的补偿效应（扩展数据图7a-c）。
为了探讨转录活性位点的分子间接触可能促进ecDNA物种协调遗传的观点，我们接下来研究了转录抑制是否可以破坏ecDNA的共分离。
我们测试了三种不同的转录抑制剂——雷公藤内酯、5,6-二氯苯并咪唑-1-β-D-呋喃核苷（DRB）和放线菌素D，这些抑制剂分别针对RNA聚合酶II转录起始和延伸的不同步骤42,43,44,45（图2e和扩展数据图7d-g）。
我们发现，雷公藤内酯在五种癌症细胞模型中显著减少了ecDNA的共分离，这通过DNA-FISH和有丝分裂后期细胞的Aurora激酶B免疫荧光成像测量得出（所有细胞系与雷公藤内酯处理的配对比较P = 0.00399；在单个细胞系比较中，SNU16m1、CA718和H716的P < 0.05，GBM39KT-D10和TR14不显著；DRB和放线菌素D在SNU16m1中对共分离没有影响；图2f和扩展数据图7h,i）。
为了进一步排除雷公藤内酯的潜在脱靶效应，我们用雷公藤内酯的拮抗剂ZL-12A预处理细胞，ZL-12A通过与相同的半胱氨酸（Cys342）反应诱导转录因子IIH（TFIIH）解旋酶ERCC3的降解，从而减弱雷公藤内酯触发的RNA聚合酶II降解46（扩展数据图7d）。
ZL-12A预处理阻断了雷公藤内酯对活性RNA聚合酶II以及ecDNA物种共分离的影响（扩展数据图7j-m），证实了转录起始对ecDNA共分离的特异性效应。
由于雷公藤内酯通过TFIIH复合物作用于转录起始而不是RNA转录的延伸45（扩展数据图7d），这些结果表明，转录起始而非转录延伸促进了ecDNA的共分离。
我们在仅3.5小时的雷公藤内酯处理后观察到了ecDNA共分离的减少，这表明在有丝分裂前或有丝分裂期间短时间内抑制转录可以破坏ecDNA的共分离。
与这一结果一致的是，ecDNA在有丝分裂开始时仍然保持转录活性，如在有丝分裂前期含有ecDNA的细胞中观察到新生致癌基因RNA-FISH信号，而在同一致癌基因位于染色体上的细胞中则没有观察到（图2g）。
综上所述，我们的活细胞成像和化学扰动实验支持这样一个观点：有丝分裂前和有丝分裂开始时的分子间接近和活跃转录有助于ecDNA物种的协调遗传进入子代细胞。

Modelling of ecDNA co-assortment

Para_01

通过观察 ecDNA 的共分离现象，我们接下来评估了共选择和共分离在塑造 ecDNA 共分类模式中的各自贡献，使用进化建模方法。
类似于先前的工作，我们实施了一个基于个体的、前向时间的进化框架，研究在生长的肿瘤群体中 ecDNA 的动态（图 3a 和方法部分）。
该模型以一个携带两种不同 ecDNA 物种且具有相同拷贝数的创始细胞实例化。
细胞根据一个‘适应度’函数分裂或死亡，该函数根据每种 ecDNA 物种的存在来确定它们的出生率。
在细胞分裂过程中，ecDNA 拷贝根据‘共分离’参数在子细胞之间继承：值为 0 表示独立随机分离，值为 1 表示完全相关分离。
通过模拟 100 万个癌细胞在对两个独立 ecDNA 物种的选择下（图 3b-e 和扩展数据图 8a,b），我们发现：(1) ecDNA 物种的共存主要由多代的共同选择压力驱动，共分离对其有一定的协同作用（图 3b,c）；(2) 细胞中 ecDNA 拷贝数的相关性主要由共分离驱动，在细胞分裂过程中按比例继承 ecDNA 拷贝（图 3d,e）。
一旦癌细胞群体达到高拷贝数，ecDNA 共存变得相对稳定（扩展数据图 8b）。
我们进一步使用另一种 ecDNA 进化模型验证了这些趋势（方法部分和扩展数据图 8c-e）。

Fig. 3: Evolutionary modelling of ecDNA dynamics reveals the principles of ecDNA co-inheritance.

a, 本研究中使用的进化建模框架。从携带用户定义的不同 ecDNA 物种（此处模拟了 2 种）和用户定义的初始拷贝数的单个亲代细胞开始模拟癌症群体。细胞根据适应度函数分裂，该函数由用户定义的选择系数参数化。在细胞分裂过程中，ecDNA 根据共分离系数遗传。

b–e, 在不同共选择和共分离系数下，从一个含有每种 ecDNA 物种五个拷贝的亲代细胞开始，1 百万细胞群体和十个重复的汇总统计。显示了所有模拟中的携带两种 ecDNA 物种的细胞的平均频率（b）和细胞内 ecDNA 拷贝数的皮尔逊相关性（d）。显示了在以下固定共选择水平下的共分离水平的函数关系：0.0、0.5 和 1.0。携带两种 ecDNA 物种的细胞的平均频率（c）和细胞内 ecDNA 拷贝数的皮尔逊相关性（e）。阴影区域表示实验重复的 95% 置信区间。对携带一种但不同时携带两种 ecDNA 的细胞的选择保持在 0.2，对不携带任何 ecDNA 的细胞的选择保持在 0.0，在所有模拟中都是如此。

f, 共选择和共分离对癌症细胞中 ecDNA 拷贝数联合分布影响的示意图。

g, 推断出的 SNU16m1、TR14 和 GBM39-KT 细胞系的共分离和共选择值的 95% 可信区间。

h, ecDNA 共进化动态的概念总结。

Para_02

由于共选择和共出现会在 ecDNA 的联合分布上留下不同的特征（图 3f 和扩展数据图 8a），我们试图根据实验观察到的细胞中 ecDNA 拷贝数分布来推断 ecDNA 共选择和共分离的水平。
将我们的进化模型与通过单细胞 ATAC-seq 获得的 ecDNA 拷贝数分布相结合，我们使用近似贝叶斯计算（ABC）来推断个体选择、共选择和共分离的后验分布（图 3g，方法和扩展数据图 8f–h）。
作为验证，推断出的共分离水平与使用 DNA-FISH 在分裂细胞中实验观察到的结果非常接近（图 2c,d 和图 3g 以及扩展数据图 5d）。
这一分析推断出癌细胞中 ecDNA 物种的共选择水平远高于其个体选择水平（扩展数据图 8g,h）。
在较高的初始拷贝数下，共选择对我们推断程序的重要性降低（实际上扩大了 95% 的置信区间），而共分离参数在不同拷贝数下保持稳定（扩展数据图 8h），这与 ecDNA 物种的共分离即使在高 ecDNA 丰度下也能维持其相关分布在细胞中的观点一致。
综上所述，这些结果表明共选择和共分离是癌细胞群体中 ecDNA 共分配的基础（图 3h）。

An altruistic enhancer-only ecDNA

Para_01

接下来，我们评估了共选择和共分离如何影响那些本身不编码致癌基因但与其他 ecDNA 分子相互作用的 ecDNA 分布。
我们最近在亲本 SNU16 胃癌细胞系中发现了一种 ecDNA 物种，其中不包含致癌基因编码序列，而是源自 WDR11 和 FGFR2 之间的非编码基因组区域。
该区域具有可接近的染色质，并被组蛋白 H3 赖氨酸 27 乙酰化（H3K27ac）标记，与 FGFR2 启动子接触，表明存在活跃的增强子（图 4a 和扩展数据图 9a）。
至少其中一个增强子区域对于 ecDNA 上的致癌基因激活是必需的，这通过 CRISPR 干扰靶向增强子区域后 FGFR2 表达减少得到证实（扩展数据图 9a,b）。
长读长测序显示，这种增强子 ecDNA 是由两个反向的 DNA 段连接在一起形成的环状分子（扩展数据图 9a）。
由于不同 ecDNA 分子之间调节元件的分子间相互作用可以驱动致癌基因表达，因此在 ecDNA 分子池中存在扩增的增强子元件可能支持跨染色体的增强子-启动子相互作用，进一步上调致癌基因表达——即‘利他’ecDNA。
仅含增强子的 ecDNA 可能特别敏感于同一 ecDNA 枢纽中的致癌基因编码 ecDNA 的共发生，以发挥其调控作用。
根据我们对 ecDNA 共进化的模型进行的模拟表明，共分离和共选择协同作用，使大多数癌细胞中维持仅含增强子的 ecDNA 和编码致癌基因的 ecDNA（图 4b,c），并且共选择对于维持仅含增强子的 ecDNA 尤为重要（扩展数据图 9c,d）。

Fig. 4: Specialization and therapeutic remodelling of ecDNA species.

从上到下，ATAC-seq；H3K27ac ChIP–seq（染色质免疫沉淀测序）；WGS；SNU16 细胞中指定 ecDNA 的 CRISPR–CATCH 测序；WGS 和 CRISPR–CATCH 测序的增强子 ecDNA 全基因组读取密度图。

FGFR2 和仅增强子 ecDNA 的共存模拟。仅携带 FGFR2 ecDNA 的细胞具有累加的共选择优势。箱线图显示中位数（中心线）、上下四分位数（箱限）和 1.5 倍四分位距（须）。

每组参数设置 1,000,000 个细胞，重复 10 次。

增强子 ecDNA 与 FGFR2 ecDNA 的共选择。

d、e，针对增强子、MYC 和 FGFR2 序列的 SNU16 细胞代表性中期 DNA-FISH 图像（n = 64 个细胞）（d），以及 ecDNA 频率的量化（e）。对于 d，比例尺为 10 µm。白色箭头指示仅增强子 ecDNA 物种。

f，通过 Aurora 激酶 B 免疫荧光鉴定的 SNU16 有丝分裂细胞的代表性图像（n = 55 个细胞对）。使用序列特异性 FISH 探针可视化单个 ecDNA。比例尺为 10 µm。增强子 DNA-FISH 探针（hg19）：10 号染色体：123023934–123065872（WI2-2856M1）。

g，每个子细胞对中的 ecDNA 物种相关性与由共价融合解释的模拟零分布相比（皮尔逊相关系数 R；使用 Fisher 的 z 转换和双侧检验计算观察到的相关性与零分布的 P 值）。误差带表示 95% 置信区间。

h，在 SNU16m1 细胞中用 pemigatinib 抑制 FGFR2。

i，模拟 pemigatinib 抑制有或无共分离时的 ecDNA 拷贝数；药物降低选择和共选择值（对于至少携带一个 FGFR2 拷贝的细胞为 -0.1）。

j，持续或间歇性 pemigatinib 治疗与 DMSO 治疗相比，SNU16m1 细胞中 FGFR2 和 MYC ecDNA 的拷贝数差异。

k，用 pemigatinib（n = 81 个细胞）或 DMSO（n = 66 个细胞）处理 6 周后的 SNU16m1 细胞代表性中期 DNA-FISH 图像（左）。右，中期分裂染色体中 FGFR2 整合的量化。统计分析使用双侧 Wilcoxon 秩和检验。比例尺为 10 µm。

l，pemigatinib 选择下的基因组变化示意图。

Para_02

为了量化仅增强子的 ecDNA 物种的频率，我们使用针对 MYC 和 FGFR2 编码序列以及增强子序列的非重叠探针进行了中期 DNA-FISH（方法）。
分析显示，在 SNU16 细胞中约 20% 的 ecDNA 分子含有这种增强子序列但不含任何致癌基因（与亲本 SNU16 细胞系中的 CRISPR-CATCH 丰富度一致；图 4a），并且绝大多数单个细胞（98%，64 个细胞中有 63 个）含有仅增强子的 ecDNA 物种（图 4d,e）。
对正在进行有丝分裂的姐妹细胞对的分析进一步表明，增强子序列与 MYC 和 FGFR2 ecDNA 分子的共分离显著高于仅由共价连接解释的水平（R > 0.80，每次比较的 P < 1 × 10−6；图 4f,g 和方法）。
这些结果支持了这样一个理论：通过与携带致癌基因的 ecDNA 的协同相互作用，可以产生并稳定维持没有致癌基因的特化 ecDNA。

Pharmacological effects on ecDNA species

Para_01

ecDNA 可以驱动基因组在药物治疗下的快速进化，包括通过拷贝数调节和产生含有抗性促进基因的新 ecDNA。
我们假设，在靶向药物治疗下，相互作用的 ecDNA 种类的共分离和共选择可能导致拷贝数的耦合动态变化。
为了验证这一假设，我们使用 FGFR2 抑制剂 pemigatinib 对 SNU16m1 胃癌单克隆细胞系进行了药物处理（该细胞系含有参与分子间增强子-启动子相互作用的 MYC 和 FGFR2 ecDNA；图 4h）。
尽管 SNU16m1 细胞具有克隆性质，但细胞之间存在高度的 ecDNA 拷贝数异质性（单个细胞中的 MYC ecDNA 拷贝数为 5-300 个，FGFR2 ecDNA 拷贝数为 100-500 个；扩展数据图 2j）。
这些克隆细胞中的 MYC 和 FGFR2 ecDNA 种类在拷贝数上是相关的（扩展数据图 2j），这与单细胞克隆可以通过细胞分裂时的非对称共分离在子代细胞中建立异质但相关的 ecDNA 拷贝数的观点一致。
预计 pemigatinib 会减少高表达 FGFR2 的细胞的选择优势，导致细胞群体中 FGFR2 ecDNA 的丢失。
当细胞用针对单一 ecDNA 种类的药物（如 pemigatinib 靶向 FGFR2 ecDNA 的基因产物）进行处理时，我们的模拟预测只有在这些 ecDNA 共分离的情况下，共存的 ecDNA 才会有协调的拷贝数动态变化（图 4h、i，方法和扩展数据图 10a）。
模拟进一步预测，药物去除后，目标 ecDNA 种类的拷贝数会逐渐恢复（图 4i）。

Para_02

为了实验性地测试这些预测，我们用 5 μM pemigatinib 处理 SNU16m1 细胞 6 周（图 4h，j）。
正如共分离 ecDNA 的模拟所预测的那样，这种靶向 FGFR2 抑制导致 FGFR2 和 MYC ecDNA 初始协调减少（图 4h，j 和扩展数据图 10b），支持了这两种 ecDNA 物种尽管没有共价连接但协调遗传的观点（通过药物治疗前 3 周后的中期 DNA-FISH 验证了不同的 ecDNA 物种；扩展数据图 10c，e）。
然而，虽然持续用 pemigatinib 处理的细胞保持低 FGFR2 副本数，MYC ecDNA 副本数在第 3 周后恢复并进一步扩增，表明 MYC ecDNA 可能在对药物耐药的细胞中最终被选择（图 4j（深橙色））。
我们进一步发现，虽然 MYC 在高副本数的 ecDNA 上被选择，剩余的 FGFR2 副本在第 6 周逐渐整合到染色体中（图 4k）。
重要的是，虽然先前的研究报告称 ecDNA 可以整合到染色体中，我们的结果表明，其染色体整合可以通过逃避共遗传来促进药物耐药性（图 4l 和扩展数据图 10f）。
在实验中途暂时移除 pemigatinib 2 周后，FGFR2 和 MYC ecDNA 副本数恢复，并且在重新添加药物后重新建立了两种 ecDNA 物种的共减少敏感性，表明协调的副本数动态可以在几个细胞世代内迅速重新建立（图 4j（浅橙色））。
最后，在不含有 FGFR2 ecDNA 的 COLO 320DM 结直肠癌细胞系中，pemigatinib 并未导致 MYC ecDNA 的丢失（图 1c 和扩展数据图 10d），表明 SNU16m1 细胞中 MYC ecDNA 的丢失是由于与 FGFR2 ecDNA 的耦合。

Para_03

为了进一步证明选择压力下 ecDNA 物种协调动态的一般性，我们用靶向 MDM2 抑制剂 nutlin-3a 处理了神经母细胞瘤 TR14 细胞。
MDM2 抑制导致共分离的 MDM2 和 MYCN ecDNA 在 TP53 依赖的方式下同时耗尽，这表明通过 TP53 通路，ecDNA 协同耗尽对 MDM2 活性的分子特异性（方法和扩展数据图 10g–j）。
相反，靶向抑制下 ecDNA 的协同耗尽不能用对快速分裂细胞的一般细胞毒性效应来解释，因为一般细胞毒性药物并不总是减少 ecDNA 含量（依托泊苷或氟尿嘧啶；扩展数据图 10k–l；低剂量羟基脲如先前报道的那样减少了 ecDNA 含量）。

Para_04

这些结果共同表明，针对携带一种 ecDNA 物种的致癌基因的药物可以协调调节共存的 ecDNA 物种，这既是因为特定致癌基因的选择优势降低（例如，pemigatinib 靶向 FGFR2），也因为通过物理共分离对其他 ecDNA 物种产生间接影响。
然而，当药物靶向的致癌基因通过染色体整合而与 ecDNA 共遗传解耦时，抗药性可能会出现。

Discussion

Para_01

癌症中的 ecDNA 扩增具有高度异质性和动态性，涉及随着时间的推移和对选择压力（如药物治疗）的响应而演变和复杂化的 DNA 物种混合物。
通过单细胞测序、成像、进化建模和多种癌症类型的化学扰动，我们已经证明了不同的 ecDNA 物种在癌细胞中共存，它们在有丝分裂过程中共同分离，并且这些进化关联促进了 ecDNA 的专业化和对靶向治疗的反应。
我们还证明了分子间相互作用和活跃的转录促进了 ecDNA 物种的共分离。
我们提供的证据表明，ecDNA 共分离与 CIP2A–TOPBP1 复合体诱导的 DNA 片段损伤聚集不同（扩展数据图 7），这可能是因为大多数 ecDNA 缺乏双链断裂（如脉冲场凝胶电泳所示），而双链断裂是 CIP2A 招募所必需的。

Para_02

虽然单个 ecDNA 在有丝分裂期间随机遗传，但不同 ecDNA 的共分离和共同选择协同维持了细胞世代间合作的 ecDNA 集体。
这种 ecDNA 集体的协调行为对我们理解癌症进化和开发癌症疗法具有重要意义。
首先，结构多样化的 ecDNA 的共同选择可能导致功能专业化（例如仅增强子的 ecDNA），这表明可能存在 ecDNA 的互动模块，例如在分子间 ecDNA 枢纽中。
其次，我们的药理学实验表明，针对某种 ecDNA 基因产物的治疗干预可能会影响共存的 ecDNA，并进一步强调在选择压力下，ecDNA 物种的共分离会产生高度动态和复杂的行为。
然而，ecDNA 物种的最终解耦表明，简单利用共分离的疗法并不能保证‘治愈’肿瘤细胞中的 ecDNA。
相反，急性靶向治疗可能会因 ecDNA 共分离而引发快速的、潜在的治疗优势的基因组重塑。
第三，我们的计算框架可以从单细胞基因组或成像数据中评估 ecDNA 的共分离和共同选择，从而提供机会来理解 ecDNA 在肿瘤中如何共同进化。

Para_03

ecDNA 在癌细胞中表现出攻击性行为，因为它们可以迅速改变拷贝数，并发展出新的基因调控关系。
这种加速的进化和探索遗传和表观遗传空间的能力受到其潜在瞬时性质的挑战——如果 ecDNA 随机传递，下一代子细胞中可能不会存在一组获胜的 ecDNA 组合。
ecDNA 共同遗传使癌细胞能够在加速进化与跨代遗传和表观遗传记忆之间取得平衡，增加了不同 ecDNA 种类组合一起传递给子细胞的概率（图 3e）。
其结果是产生了一种累积效应，支持异质 ecDNA 之间的合作，使多个致癌基因共同扩增，并继续癌症基因组的多样化。
除了癌症进化之外，我们关于协调不对称遗传的一般框架可能适用于控制细胞命运的病毒外显子、亚细胞器或生物分子凝聚体。

Methods

Cell culture

细胞培养

Para_01

TR14 神经母细胞瘤细胞系由 J. J. Molenaar（Princess Máxima 儿科肿瘤中心）提供。
主细胞库的身份通过 STR 分型（IDEXX BioResearch）进行了验证。
GBM39-KT 细胞系来自明尼苏达州罗切斯特市梅奥诊所手术的一名胶质母细胞瘤患者，如前所述。
通过限制稀释从 GBM39-KT 细胞中分离出单克隆球体，生成了 GBM39-KT-D10。
CA718 细胞系来自一名胶质母细胞瘤患者，如前所述，并从加利福尼亚大学圣地亚哥分校 Moores 癌症中心获得。
亲代 SNU16、COLO 320DM、H716 和 HCT116 细胞购自 ATCC。
SNU16m1 是通过慢病毒转导和稳定表达 dCas9-KRAB 从亲代 SNU16 细胞中生成的一个亚系，如我们之前所述。
SNU16 和 SNU16m1 细胞在 Dulbecco 改良 Eagle 培养基/营养混合物 F-12（DMEM/F12 1:1；Gibco, 11320-082）、10% 胎牛血清（FBS；Hyclone, SH30396.03）和 1% 青霉素-链霉素（Thermo Fisher Scientific, 15140-122）中培养。
COLO 320DM 细胞在 DMEM（Thermo Fisher Scientific, 11995073）中培养，补充 10% FBS 和 1% 青霉素-链霉素。
GBM39-KT 细胞在 DMEM/F12 1:1、B-27 补充剂（Gibco, 17504044）、1% 青霉素-链霉素、GlutaMAX（Gibco, 35050061）、人表皮生长因子（EGF，20 ng/ml；Sigma-Aldrich, E9644）、人成纤维细胞生长因子（FGF，20 ng/ml；Peprotech）和肝素（5 μg/ml；Sigma-Aldrich, H3149-500KU）中培养。
TR14 细胞在含有 20% FBS 和 1% 青霉素-链霉素的 RPMI 1640 中培养。
对于图 2 中的有丝分裂细胞成像实验，SNU16m1 细胞在含有 10% FBS 的 RPMI 1640 中培养。
H716 细胞在 ATCC 配制的 RPMI 1640（Gibco, A1049101）中培养，补充 10% FBS 和 1% 青霉素-链霉素-谷氨酰胺。
用于活细胞成像的 COLO 320DM 细胞、PC3 和 HCT116 在 DMEM（Corning, 10-013-CV）中培养，补充 10% FBS 和 1% 青霉素-链霉素-谷氨酰胺。
所有细胞均在 37 °C 和 5% CO2 条件下培养。
所有细胞系均检测为支原体阴性。

Chemicals

化学品

Para_01

BRD4双价降解剂由M. M. Hassan和N. S. Gray赠送，并用DMSO配制成10 mM的储备液。
雷公藤内酯（Millipore, 645900）用DMSO配制成55 mM的储备液，最终使用浓度为10 µM。
放线菌素D（Millipore Sigma, SBR00013）最终使用浓度为5 µg ml−1。
DRB（Sigma-Aldrich, D1916）用DMSO配制成70 mM的储备液，最终使用浓度为200 µg ml−1。
ZL-12A按先前报道的方法合成，并用DMSO配制成20 mM的储备液，最终使用浓度为50 µM，持续3小时。
在雷公藤内酯预处理实验中，先加入ZL-12A 3小时，然后用1× PBS洗涤，再加入DMSO或雷公藤内酯（10 µM）3.5小时。

Genetic knockout of CIP2A

CIP2A基因敲除

Para_01

使用 SNU16m1 细胞创建了 CIP2A 敲除细胞，具体如下。
我们使用 CHOPCHOP（https://chopchop.cbu.uib.no）设计了一个针对 CIP2A 蛋白编码区域的引导 RNA 序列，以及一个非靶向对照 sgRNA（引导序列见补充表 1）。
为了将每个引导 RNA 与 CRISPR-Cas9 一起递送到细胞中，我们将纯化的链球菌 Cas9 核酸酶（Alt-R S.p. Cas9 Nuclease V3；IDT，1081058）与每个单引导 RNA（sgRNA；用 1× TE 缓冲液稀释至 30 μM；Synthego）按 1:6 的摩尔比混合在 Neon 重悬缓冲液 R（Thermo Fisher Scientific）中，并在室温下孵育 10 分钟以形成 Cas9 核糖核蛋白（RNP）复合物。
SNU16m1 细胞收集后，用 1× PBS 洗涤两次，然后在含有 Cas9 RNP 的 Buffer R 中重悬，最终浓度为每 10 μL Neon 反应液含 300,000 个细胞和 0.71 μM Cas9 复合物。
使用 Neon 转染系统（Thermo Fisher Scientific，MPK5000）根据制造商的协议进行转染，使用 10 μL 的尖端，参数设置为：1,400 V，20 m s−1，2 次脉冲。
每种引导条件的三个 Neon 反应合并，得到 900,000 个细胞，用于对照或 CIP2A 敲除基因型。

WGS

世界地理系统（World Geodetic System）

Para_01

WGS文库通过DNA标签化制备。
我们首先使用先前描述的方法生产的Tn5转座酶对基因组DNA进行转座，反应体系为50 µl，包含TD缓冲液、50 ng DNA和1 µl转座酶。
反应在50 °C下进行5分钟，然后使用MinElute PCR纯化试剂盒（Qiagen, 28006）纯化转座的DNA。
文库通过5-7轮PCR扩增生成，使用NEBNext高保真2× PCR主混合物（NEB, M0541L），并通过SPRIselect试剂盒（Beckman Coulter, B23317）进行双尺寸选择（0.8×右侧，1.2×左侧）纯化，随后在Illumina NextSeq 550或Illumina NovaSeq 6000平台上测序。
使用Trimmomatic（v.0.39）去除读段中的接头序列，使用BWA MEM（0.7.17-r1188）将读段比对到hg19基因组，并使用Picard的MarkDuplicates（v.2.25.3）去除PCR重复。
批量SNU16细胞的WGS数据先前已生成（SRR530826，Genome Research Foundation）。

Analysis of ecDNA sequences in TCGA patient tumours

TCGA患者肿瘤中ecDNA序列的分析

Para_01

我们基于 TCGA 的批量 WGS 数据使用 AmpliconArchitect (AA) 方法进行 ecDNA 检测，以分析基因组焦点扩增。
该方法的输出此前已发表。
简而言之，这种检测 ecDNA 的方法包括三个通用步骤，这些步骤被封装在我们称为 AmpliconSuite-pipeline 的工作流中（https://github.com/AmpliconSuite/AmpliconSuite-pipeline，v.1.1.1）。
首先，给定一个 BAM 文件，分析管道检测存在拷贝数扩增的种子区域（CN > 4.5 且大小在 10 kb 到 10 Mb 之间）。
其次，AA 在焦点扩增区域内进行拷贝数和断裂点的联合分析，形成一个拷贝数感知的局部基因组图谱。
AA 从该图中提取路径，代表基因组结构和亚结构，解释拷贝数的变化。
最后，使用 AmpliconClassifier (AC) 进行基于规则的分类，根据 AA 提取的路径预测焦点扩增的模式。
这包括评估结构变异类型、片段拷贝数以及 AA 提取的基因组路径结构。
此外，AC 根据路径长度和拷贝数等标准识别 ecDNA 循环，提供了一个基于结构特征对扩增子进行全面分类的系统。
例如，如果拷贝数变化主要由一个或多个包含结构变异的环状基因组路径解释，这些路径以头尾相连的方式闭环化，这与 ecDNA 扩增模式一致；而断裂-融合-桥接基因组结构则包含多个折叠和多个以回文排列的基因组片段。
完整的分类标准和 AC 工具的描述可在参考文献 62 的补充信息中找到。

Para_02

我们使用了先前研究中的 AA（v.1.0）输出，并使用 AC（v.0.4.14）对这些输出中存在的焦点扩增类型进行分类，设置了‘--filter_similar’标志，其余设置为默认。
'--filter_similar'选项移除可能的假阳性焦点扩增调用，这些调用包含远高于预期水平的重叠结构变异和不相关样本之间 ecDNA 的共享基因组边界。
简而言之，AC 评分评估焦点扩增的结构相似性。这些评分考虑了基因组区间重叠和共享断点连接，如果断点的总距离小于指定阈值（默认 = 250 bp），则认为断点是共享的。
此外，AC 计算来自不同起源的扩增子的相似性评分，建立一个背景空分布以供比较。该工具使用 β 分布模型拟合经验空分布，提供相似性评分的统计显著性估计。
在参考文献 19 的 TCGA 数据集中 8,810 个 AA 扩增子中，有 45 个候选焦点扩增被此过滤器移除。

Para_03

为了预测样本中存在的不同 ecDNA 物种的数量，我们使用了 AC 报告的每个焦点扩增的基因组区间。
AC 通过聚类 ecDNA 基因组区间来确定存在的不同、基因组非重叠的 ecDNA 物种数量，如果这些区域由结构变异连接或区域边界在 500 kb 以内。
如果区间不符合这些标准，AC 预测它们是不连接的，并将它们报告为不同的 ecDNA 物种。
AC 使用了一个结合了 ONGene 数据库和 COSMIC 中的致癌基因列表。

Paired scATAC-seq and scRNA-seq library generation

配对的单细胞ATAC测序和单细胞RNA测序文库生成

Para_01

单细胞配对 RNA-seq 和 ATAC-seq 文库在 10x Chromium Single-Cell Multiome ATAC + 基因表达平台上根据制造商的协议生成，并在 Illumina NovaSeq 6000 系统上进行测序。
COLO 320DM 的数据此前已生成并发布于 Gene Expression Omnibus (GEO) 数据库，编号为 GSE159986。

Paired scATAC-seq and scRNA-seq analysis

配对的单细胞 ATAC 测序和单细胞 RNA 测序分析

Para_01

使用 cellranger-arc mkref（10x Genomics，v.1.0.0）创建了 hg19 的自定义参考包。
使用 cellranger-arc count（10x Genomics，v.1.0.0）将单细胞配对的 RNA-seq 和 ATAC-seq 读段比对到 hg19 参考基因组。

Para_02

后续对 RNA 的分析使用了 Seurat（v.3.2.3），对 ATAC-seq 的分析使用了 ArchR（v.1.0.1）。
保留了具有超过 200 个独特 RNA 特征、线粒体 RNA 读数少于 20% 和总 RNA 读数少于 50,000 的细胞进行进一步分析。
使用 ArchR 去除了双倍体细胞。
原始 RNA 计数使用 Seurat 的 NormalizeData 函数进行了对数归一化，并使用 ScaleData 函数进行了缩放。
使用 ArchR 中的 addIterativeLSI 函数通过迭代潜在语义索引（LSI）对 ATAC-seq 数据进行了降维。

Para_04

对于扩展数据图 5a–c 中展示的分析，我们使用 Seurat 包中的 CellCycleScoring 函数和包含在 Seurat 包中的 S 和 G2M 期基因集，从每个细胞的 RNA 测序数据推断细胞周期阶段。
然后，根据推断出的细胞周期阶段（G1、S 或 G2M）对细胞进行分组，评估了拷贝数相关性。

scCircle-seq analysis

scCircle-seq 分析

Para_01

TR14 scCircle-seq 数据之前已生成，并存放在欧洲基因-表型档案（EGA）中，访问号为 EGAS00001007026。
单细胞染色体外环状 DNA 和转录组测序（scEC&T-seq）协议的详细描述可在 Nature Protocol Exchange 上获取（https://doi.org/10.21203/rs.3.pex-2180/v1）。
单细胞被分选，通过 G&T-seq 分离基因组 DNA 和 mRNA，单细胞的基因组 DNA 经过核酸外切酶消化和滚环扩增，如前所述。

Para_02

scCircle-seq 读段的处理已在先前详细描述过。
简而言之，使用 Trim Galore (v.0.6.4) 对 scCircle-seq 测序读段进行 3' 端质量修剪，并移除长度短于 20 个核苷酸的接头序列。
使用 BWA MEM (v.0.7.15) 和默认参数将读段比对到人类参考组装 hg19。
使用 Picard (v.2.16.0) 移除 PCR 和光学重复。
线粒体 DNA 上的测序覆盖度被用作内部对照，以评估环状 DNA 的富集情况。
对于线粒体 DNA 上每碱基序列深度少于 10 个读段或捕获到的基因组碱基数少于 85% 的细胞，从进一步分析中排除。

Para_03

从 scCircle-seq BAM 文件中量化了 TR14 ecDNA 区域（MYNC、CDK4、MDM2）的读数计数，这些区域是根据先前描述的 TR14 大群体中的 ecDNA 重建分析定义的。为了校正细胞之间的测序深度差异，读数计数已归一化到文库大小。

Analysis of copy-number correlations of amplified oncogenes in human tumour samples

人类肿瘤样本中扩增癌基因的拷贝数相关性分析

Para_01

使用上述描述的单细胞 scATAC-seq（见‘配对的 scATAC-seq 和 scRNA-seq 分析’部分）计算的单细胞拷贝数用于设计一种预测 ecDNA 的统计方法。
我们认为，由于单个 ecDNA 分子的随机分离，ecDNA 焦点扩增不仅表现为较高的平均拷贝数，还表现为较高的拷贝数方差。
确实，将平均拷贝数≥4且方差/均值比≥2.5的扩增分类，仅能特异性地分类验证细胞系中的已知 ecDNA（扩展数据图 4a）。

Para_02

我们将这种统计方法应用于一个精心策划的数据集，该数据集包含41个肿瘤（来自三阴性乳腺癌（TNBC）、高级别浆液性卵巢癌（HGSC）和胶质母细胞瘤），这些肿瘤具有公开可用的单细胞ATAC测序（scATAC-seq）或单细胞DNA测序（scDNA-seq）数据。
对于使用scDNA-seq数据表征的TNBC和HGSC肿瘤，我们使用了作者提供的单细胞拷贝数，这些数据可在Zenodo上获取（https://doi.org/10.5281/zenodo.6998936）。
处理过的胶质母细胞瘤样本的scATAC-seq数据从参考文献34和36（GEO存取号GSE163655）获得，并且拷贝数是按照上述方法（参见‘配对scATAC-seq和scRNA-seq分析’部分）在3Mb基因组窗口中计算的。
潜在的ecDNA通过从已验证的细胞系中确定的决策规则进行预测，并通过平均与感兴趣的致癌基因重叠的窗口的拷贝数来确定致癌基因的拷贝数。
拷贝数相关性仅在拷贝数≥4的细胞中计算，这些细胞中的致癌基因被放大。

ecDNA isolation by CRISPR–CATCH

通过 CRISPR–CATCH 隔离 ecDNA

Para_01

通过 CRISPR-CATCH 进行 ecDNA 的分子分离是按照先前描述的方法进行的。
简而言之，将 1% 的认证低熔点琼脂糖（Bio-Rad, 1613112）在 PBS 中融化，并平衡至 45°C。
每种条件下，100 万个细胞被离心，用冷的 1× PBS 洗两次，重悬于 30 µl PBS 中，并短暂加热至 37°C。
然后，向细胞中加入 30 µl 琼脂糖溶液，混合后转移到插件模具（Bio-Rad, 1703713）中，在冰上孵育 10 分钟。
含有细胞的固体琼脂糖插件被弹射到 1.5 ml Eppendorf 管中，悬浮在缓冲液 SDE（1% SDS，25 mM pH 8.0 的 EDTA）中，并在摇床上放置 10 分钟。
移除缓冲液，加入缓冲液 ES（1% N-月桂基肌氨酸钠盐溶液，25 mM pH 8.0 的 EDTA，50 µg ml⁻¹ 蛋白酶 K）。
琼脂糖插件在 50°C 下在缓冲液 ES 中孵育过夜。
第二天，用 25 mM EDTA 和 1 mM PMSF 在室温下摇动 1 小时使蛋白酶 K 失活。
然后，用 25 mM EDTA 中的 1 mg ml⁻¹ RNase A 在 37°C 下处理插件 30 分钟，并用 25 mM EDTA 洗涤，孵育 5 分钟。
不直接用于 ecDNA 丰富的插件储存在 4°C 的 25 mM EDTA 中。

Para_02

为了进行体外 Cas9 消化，含有 DNA 的琼脂糖插块用 1× NEBuffer 3.1（New England BioLabs）洗涤三次，每次孵育 5 分钟。
接下来，在反应混合物预孵育 10 分钟后，DNA 在 30 nM sgRNA（Synthego）和 30 nM spCas9（New England BioLabs, M0386S）的作用下进行消化。
Cas9 消化在 37 °C 下进行 4 小时，然后加入 3 µl 蛋白酶 K（20 mg ml−1）在 200 µl 反应体系中过夜消化。
第二天，用 1 mM PMSF 振荡处理 1 小时使蛋白酶 K 失活。
然后用 0.5× TAE 缓冲液洗涤插块三次，每次孵育 5 分钟。
将插块加载到 1% 认证低熔点琼脂糖凝胶（Bio-Rad, 1613112）中，使用 0.5× TAE 缓冲液，并加入梯度（CHEF DNA 尺寸标记，0.2–2.2 Mb；酿酒酵母梯度，Bio-Rad, 1703605；CHEF DNA 尺寸标记，1–3.1 Mb；Hansenula wingei 梯度，Bio-Rad, 1703667），并使用 CHEF Mapper XA 系统（Bio-Rad）根据制造商的说明进行脉冲场凝胶电泳，设置如下：0.5× TAE 运行缓冲液，14 °C，双相模式，运行时间 16 小时 39 分钟，初始切换时间为 20.16 秒，最终切换时间为 2 分 55.12 秒，梯度为 6 V cm−1，包含角度为 120° 和线性斜坡。
凝胶用 3× Gelred（Biotium）和 0.1 M NaCl 在摇床上避光染色 30 分钟并成像。
然后提取条带，使用 β-琼脂糖酶 I（New England BioLabs, M0392L）从琼脂糖块中分离 DNA，操作步骤按照制造商的说明进行。
所有引导序列见补充表 1。

Short-read sequencing of ecDNA isolated by CRISPR–CATCH

通过CRISPR-CATCH分离的ecDNA的短读长测序

Para_01

通过CRISPR–CATCH分离的ecDNA测序按照先前描述的方法进行。
简而言之，我们使用先前描述的方法产生的Tn5转座酶在50 µl反应体系中与TD缓冲液、10 ng DNA和1 µl转座酶一起进行DNA转座。
反应在50 °C下进行5分钟，然后使用MinElute PCR纯化试剂盒（Qiagen, 28006）纯化转座后的DNA。
文库通过7-9轮PCR扩增生成，使用NEBNext高保真2× PCR主混合液（NEB, M0541L），并通过SPRIselect试剂盒（Beckman Coulter, B23317）进行双尺寸选择（0.8×右侧，1.2×左侧）纯化，并在Illumina NextSeq 550或Illumina NovaSeq 6000平台上进行测序。
测序数据按照上述WGS方法处理。
扩展数据图3中使用的SNU16m1（带30-34）和COLO 320DM（带a-m）的CRISPR–CATCH测序数据先前已生成并存放在NCBI序列读取档案（SRA）中，BioProject编号为PRJNA670737；图4中使用的SNU16（MYC、FGFR2和增强子ecDNA）的CRISPR–CATCH测序数据先前已生成并存放在NCBI SRA中，BioProject编号为PRJNA777710。

Metaphase DNA-FISH

中期DNA荧光原位杂交

Para_01

TR14 神经母细胞瘤细胞在 15 厘米培养皿中生长至 70% 汇合度，并用 KaryoMAX 秋水仙素（Gibco）处理 4 小时。
进行有丝分裂摇落，收集细胞的培养基。
剩余的细胞用 PBS 洗涤，并用 0.05% 胰蛋白酶-EDTA（Gibco）处理 2 分钟。
细胞再次用收集的培养基洗涤，并在 300g 下离心 10 分钟。
沉淀物重新悬浮于 0.075 M KCl 中，在 37 °C 下孵育 20 分钟。
样品在 300g 下离心 5 分钟。
细胞沉淀物小心地重新悬浮于 10 毫升 Carnoy 溶液中，并在 300g 下离心 5 分钟。
此洗涤步骤重复四次，每次使用 5 毫升 Carnoy 溶液。
剩余的沉淀物重新悬浮于 400 微升 Carnoy 溶液中。
然后，从大约 15 厘米的高度将 12 微升悬浮液滴到预热的载玻片上。
将载玻片放在加热的水浴（55 °C）上 1 分钟。
载玻片在室温下过夜老化。
根据探针制造商的协议（DNA-FISH 有丝分裂染色体扩散，Arbor Biosciences），制备载玻片以进行染色。
染色前，载玻片首先用 PBS 洗涤，然后在 65 °C 的 SSCT（5 毫升 20× SSC，500 微升 10% Tween-20，并用分子级 H2O 补充至 50 毫升）中洗涤 15 分钟。
载玻片接下来在室温下用 SSCT 洗涤两次，每次 2 分钟。
载玻片在 70% 和 90% 乙醇中脱水，每次 5 分钟。
干燥后，载玻片转移到 0.07 N NaOH 中化学变性 3 分钟。
在 SSCT 中洗涤两次，每次 5 分钟后，重复脱水步骤，然后将载玻片干燥。
用于染色的探针设计为靶向 MYCN、MDM2 和 CDK4 基因，使用 myTags（Arbor），偶联如下：CDK4-Alexa 488、MYCN-Atto 550、MDM2-Atto 633。
然后，将 10 微升杂交缓冲液（在 SSCT 中：50% 甲酰胺，10% 右旋糖酐硫酸钠，40 ng/µl RNase A）与每种重悬探针的 1.5 微升混合。
该混合物在 70 °C 下加热 5 分钟，然后储存在冰上。
然后，将 14.5 微升这种混合物加到载玻片上，用盖玻片覆盖并用橡胶水泥密封。
载玻片在杂交室（Abbott Molecular）中 37 °C 下过夜孵育。
第二天，移除橡胶水泥和盖玻片，样品在预热（37 °C）的 SSCT 中洗涤 30 分钟。
然后，载玻片在室温下用 2× SSCT 洗涤两次，每次 5 分钟，接着用 PBS 洗涤 5 分钟。
干燥后的载玻片用 Hoechst（1:4,000，2 分钟）染色，并用 PBS 再次洗涤 5 分钟。
干燥后，载玻片用 ProLong Glass Antifade Mountant（Thermo Fisher Scientific）封片并用盖玻片密封。
TR14 有丝分裂扩散的成像在 Max-Delbrück 分子医学中心高级光学显微镜设施的 Leica Stellaris 8 系统上进行，使用 ×63 油浸物镜和 ×2 放大倍率。
激发使用 405 nm、488 nm、561 nm 和 538 nm 激光器，检测使用两个 HyD S 和一个 HyD X 和 HyD R 探测器。
每个通道应用 4 倍线平均。

Para_02

对于 GBM39-KT、GBM39-KT-D10、SNU16、SNU16m1、CA718 和 H716 细胞系，细胞用 KaryoMAX Colcemid（Gibco）处理，浓度为 100 ng/ml，持续 3 小时，然后通过离心收集单细胞悬液，并用 1× PBS 洗一次。
细胞用 0.75 M KCl 低渗缓冲液在 37 °C 下处理 20 分钟，然后用 Carnoy 固定液（3:1 甲醇：冰醋酸）固定，并用相同的固定液再洗三次。
样品随后滴在湿润的载玻片上并风干。
载玻片在 2× SSC 缓冲液中短暂平衡，然后在 70%、85% 和 100% 的乙醇中逐级脱水，每步 2 分钟。
FISH 探针（Empire Genomics）按 1:6 的比例稀释在杂交缓冲液中，并覆盖盖玻片。
样品在 75 °C 下变性 3 分钟，在湿盒中 37 °C 下过夜杂交。
样品用 0.4× SSC 洗 2 分钟，再用 2× SSC 0.1% Tween-20 洗 2 分钟。
细胞核用 4,6-二氨基-2-苯基吲哚（DAPI）（50 ng/ml）在 2× SSC 中染色约 1 分钟，然后在双蒸水中快速洗一次。
风干的样品用 ProLong Diamond 封片。
图像使用 Leica DMi8 宽场显微镜和 63× 油镜获取。

Metaphase DNA-FISH image analysis

中期DNA-FISH图像分析

Para_01

图1和扩展数据图2中描述的双色和三色中期FISH共定位分析是使用Fiji（v.2.1.0/1.53c）进行的。
图像被拆分为单独的FISH颜色+DAPI通道，并手动设置信号阈值以去除背景荧光。
重叠的FISH信号使用分水岭分割进行分割。
FISH信号使用颗粒分析进行计数。
包含FISH信号的像素的xy坐标与图像尺寸和感兴趣区域（ROIs）的坐标一起保存为不同的颗粒身份（例如，不同的ecDNA分子）。
然后在R中量化共定位。
每个包含FISH信号的像素根据xy坐标分配到最近的重叠ROI。
所有颜色通道中的唯一ROI被汇总，使得在同一图像中不同通道中重叠一个或多个像素的ROI被视为共定位。

Para_02

对 SNU16m1 细胞中 ecDNA 的双色中期荧光原位杂交 (FISH) 数据进行了共定位分析，如扩展数据图 10 所述。使用 Fiji (v.2.1.0/1.53c) 进行分析。
图像被拆分为两个 FISH 颜色通道和 DAPI 通道，并手动设置信号阈值以去除背景荧光。
使用分水岭分割方法对重叠的 FISH 信号进行分割。
使用 ImageJ-Colocalization Threshold 程序量化共定位，并通过颗粒分析计算单个和共定位的 FISH 信号。

Immunofluorescence staining and DNA-FISH in mitotic cells

有丝分裂细胞中的免疫荧光染色和DNA-荧光原位杂交

Para_01

为了评估图2和扩展数据图5和7所示的GBM39-KT、GBM39KT-D10、TR14、SNU16m1、CA718和H716细胞中的ecDNA有丝分裂分离，将非同步细胞培养在涂有聚-L-赖氨酸或聚-D-赖氨酸（GBM39-KT和GBM39KT-D10使用层粘连蛋白）的盖玻片上。
用PBS洗涤细胞一次，并在室温下用冷4%多聚甲醛（PFA）固定10-15分钟。
样品用0.5%曲拉通X-100在PBS中室温下透化10分钟，然后用PBS洗涤。
样品用3% BSA在含0.05%曲拉通X-100的PBS中室温下封闭30分钟。
样品用一抗（Aurora激酶B多克隆抗体，1:200稀释，A300-431A，Thermo Fisher Scientific；BRD4抗体，1:200，ab245285，Abcam；RNA聚合酶II CTD重复序列YSPTSPS（磷酸化Ser2）抗体（3E10），ab252855，Abcam；CIP2A抗体，1:400稀释，NBP2-48710，Novus Biologicals；所有抗体均在3% BSA中稀释）在室温下孵育1小时或4°C过夜。
样品用含0.05%曲拉通X-100的PBS洗涤三次。
样品用荧光标记的二抗（1:500在3% BSA中）在室温下孵育1小时（后续步骤均在暗处进行），然后用含0.05%曲拉通X-100的PBS洗涤三次。
细胞用PBS洗涤一次，再用冷4% PFA在室温下重新固定20分钟。
盖玻片用1× PBS洗涤一次，然后在冰上用新配制的1× PBS中的0.7%曲拉通X-100和0.1 M HCl孵育10分钟，随后在室温下用1.9 M HCl酸变性DNA链30分钟。
然后在70%、85%和100%的乙醇中逐级脱水，每次约2分钟。
FISH探针（Empire Genomics）在杂交缓冲液（Empire Genomics）中按1:4稀释，并加到样品上，加入载玻片。
样品在75°C变性3分钟，然后在37°C湿暗室中过夜杂交。
样品用0.4× SSC洗涤，然后用2× SSC 0.1% Tween-20洗涤（所有洗涤步骤持续约2分钟）。
将DAPI（100 ng ml-1）应用于样品10分钟。
样品再次用2× SSC 0.1% Tween-20洗涤，然后用2× SSC洗涤。
样品在双蒸水中短暂洗涤，然后用ProLong Gold封片。
载玻片用指甲油密封。
样品在DeltaVision Elite细胞成像系统（Applied Precision）、Olympus宽场显微镜（IX-71；Olympus）（由SoftWoRx软件v.6.5.2控制，使用×60物镜镜头和CoolSNAP HQ2相机（Photometrics））或Leica DMi8宽场显微镜（使用×63油物镜镜头）上成像。
获取z堆栈，并用于生成最大强度投影（ImageJ或LAS X）以进行下游分析。
在Leica DMi8上获取的图像在生成最大强度投影之前，使用小体积计算清除或大体积计算清除进行去卷积。

Para_02

为了评估图4所示SNU16细胞中致癌基因和增强子ecDNA的有丝分裂分离，将细胞接种到六孔培养板中的纤维连接蛋白包被的22 × 22盖玻片上，细胞密度约为70%。
然后，在细胞接种24小时后，用4% PFA固定细胞，并用含0.25% Triton X-100的1× PBS透化细胞。
样品在室温下用3% BSA-1× PBS封闭1小时，随后在4°C下用初级抗体（Aurora B激酶抗体；A300-431A；Thermo Fisher Scientific）（1:200稀释于3% BSA中）孵育过夜。
样品用1× PBS洗涤三次，然后在室温下用稀释的抗兔Alexa Fluor 647抗体（驴抗兔IgG（H+L）高度交叉吸附的二级抗体，Alexa Fluor 647，A31573，Invitrogen；1:500稀释于3% BSA中）孵育1小时。
然后，样品再用1× PBS洗涤三次，并在室温下用4% PFA固定20分钟。
DNA-FISH按照‘中期DNA-FISH’部分所述的方法进行，但热变性条件改为80°C持续20分钟。
使用Leica DMi8宽场显微镜和63倍油镜获取图像，每个z平面在LAS X中通过小体积计算清除后生成最大投影图像。

Mitotic cell imaging analysis

有丝分裂细胞成像分析

Para_01

为了量化图2和扩展数据图5和7所示的分裂细胞对中每个子细胞分离的ecDNA分数，使用ImageJ从最大强度投影图像中量化了ecDNA像素强度。
使用ImageJ中的‘集成密度’测量来测量ecDNA像素强度。
在量化之前，均匀地去除了整个图像中的FISH探针背景信号，直到所有子细胞核的背景信号被完全去除。
我们进一步筛选掉了质量差的图像，那些核重叠无法进行准确分割的图像，以及根据Aurora激酶B染色显示细胞配对不明确的图像。
为了测量抑制剂处理后子细胞中ecDNA的分离分数，使用AIVIA软件（Leica Microsystems）对最大强度投影图像进行了子细胞分割和DNA-FISH丰度测量。
基于感兴趣FISH探针和DAPI通道训练了个体机器学习像素分类器，分别创建了FISH信号和核的置信掩模。
使用置信掩模创建了一个配方，用于分割单个FISH点并将每个点分配给一个分割的子细胞。
通过比较每对相应子细胞中的FISH面积，估计了每种ecDNA物种的遗传比例。
使用AIVIA软件通过测量分割核中的像素强度值，量化了感兴趣蛋白质（RNA Pol II pSer2、CIP2A和BRD4）的丰度。

Para_02

为了量化图4所示的癌基因和增强子ecDNA分配给子细胞的比例，图像被分为不同的FISH颜色+DAPI通道，并使用Fiji（v.2.1.0/1.53c）手动设置信号阈值以去除背景荧光。
使用分水岭分割法对重叠的FISH信号进行分割。
除了DAPI之外的所有FISH颜色通道都被堆叠，并手动绘制ROI以识别两个子细胞，然后再次拆分颜色通道，并使用颗粒分析方法分析FISH信号占据的图像像素区域。
每个子细胞中的ecDNA比例通过该子细胞中FISH像素的比例来估算。

Nature ecDNA 系列 | 癌细胞中 ecDNA 的协调遗传

正文

Basic Information

Abstract

Para_01

Main

Para_01

Para_02

Para_03

Para_04

Distinct ecDNAs co-occur in cancer cells

Para_01

Para_02

Para_03

Para_04

Para_05

Distinct ecDNA species co-segregate

Para_01

Para_02 (adsbygoogle = window.adsbygoogle || []).push({});

Transcription promotes co-segregation

Para_01

Para_02

Modelling of ecDNA co-assortment

Para_01

Para_02

An altruistic enhancer-only ecDNA

Para_01

Para_02

Pharmacological effects on ecDNA species

Para_01

Para_02

Para_03

Para_04

Discussion

Para_01

Para_02 (adsbygoogle = window.adsbygoogle || []).push({});

Para_03

Methods

Cell culture

Para_01

Chemicals

Para_01

Genetic knockout of CIP2A

Para_01

WGS

Para_01

Analysis of ecDNA sequences in TCGA patient tumours

Para_01

Para_02

Para_03

Paired scATAC-seq and scRNA-seq library generation

Para_01

Paired scATAC-seq and scRNA-seq analysis

Para_01

Para_02

Para_04

scCircle-seq analysis

Para_01 (adsbygoogle = window.adsbygoogle || []).push({});

Para_02

Para_03

Analysis of copy-number correlations of amplified oncogenes in human tumour samples

Para_01

Para_02

ecDNA isolation by CRISPR–CATCH

Para_01

Para_02

Short-read sequencing of ecDNA isolated by CRISPR–CATCH

Para_01

Metaphase DNA-FISH

Para_01

Para_02

Metaphase DNA-FISH image analysis

Para_01

Para_02

Immunofluorescence staining and DNA-FISH in mitotic cells

Para_01

Para_02

Mitotic cell imaging analysis

Para_01

Para_02

Para_02

Para_02

Para_01