上篇推文讲到,刘如谦发明了第一代碱基编辑器 CBE 和 ABE,开启了单碱基编辑技术的时代
(详见盘点 2024 年基因编辑技术重要研究进展(二))。
接下来的问题是,第一代碱基编辑器,无论是 CBE 还是 ABE,只是同类碱基之间的转换(transition),即一种嘧啶变为另一种嘧啶(C 突变为 T),或一种嘌呤突变为另一种嘌呤(A 突变为 G)。那么能不能实现嘧啶和嘌呤之间的颠换 (transversion) 呢?从化学角度的回答是:不可能!但细胞给出的答案是可能的!所以,化学解决不了的问题还得回到生物找灵感。
第三种碱基编辑器 CGBE
线索最早来自于人们对 CBE 编辑产物的分析,发现在 CBE 编辑结果里存在小比例的 C-to-G 的突变产物(正常情况下是 C-to-T),而这个产物(C-to-G)的产生与尿嘧啶 DNA 糖基化酶(uracil-DNA glycosylase, UNG)活性有关。UNG 的作用是切除碱基,切除碱基后细胞就会启动碱基切除修复(base excision repair, BER),就可能产生非预期的编辑副产物(如 CBE 里的 C-to-G)。
先回顾一下 CBE 的机制。在 CBE 技术中,脱氨酶将 C 脱氨形成 U,U 其实是个错误碱基,此时细胞有两种反应:一种反应是没有及时发现和纠正这个小错误,错把 U 当作 T,最后就把它修改成 T(即 C-to-T,这是 CBE 编辑器想要的结果);另一种反应是很快发现了这个错误,启动碱基切除修复,将 U 切除。切除 U 之后,那个位点就形成了既没有嘧啶也没有嘌呤的空位(apurinic/apyrimidinic, AP site),而这个空位为 A、T、C、G 四种碱基都提供了上位的机会,但 G 上位机会最大(人们当时不完全了解原因)(图 1)。
在经典 CBE 系统中,为了实现 C-to-U-to-T 转换,必须避免切除 U。而负责切除 U 的酶是 UNG。所以在 CBE 中,将 UNG 的抑制蛋白 (uracil glycosylase inhibitor,UGI) 引入到 Cas9 融合蛋白中,来抑制 UNG 切除 U。如果去掉 UGI,再加上 UNG,那么就可以切除 U,就促进了 BER 的发生, G 上位的概率就显著上升。
图 1. CGBE 原理(引自【1】)
2021 年,世界上至少 4 个实验室报道了 C-to-G 碱基编辑器
【1-4】
,称为 CGBE(C-to-G base editor),包括中国天津工业生物技术研究所张学礼和毕昌昊团队
【2】
。策略就是刚才讲过的:将尿嘧啶 DNA 糖基化酶 UNG 加到 CBE 蛋白中,切掉 U,创造 AP 空位,扶持 G 上位。经过一系列优化后,在人细胞中,CGBE 对一些基因位点的编辑效率可达到 50% 以上,C-to-G 纯度可达到 90% 以上。
CGBE 是第三种碱基编辑器,它实现了嘧啶(C)到嘌呤(G)的颠换,其核心环节是启动细胞内的碱基切除修复,为之后的碱基编辑器开发提供了重要启示。
第四种碱基编辑器 AXBE 和 AYBE
很快,第四种碱基编辑器就出现了。这个编辑器叫做 AXBE(A-to-X base editor,X 代表任何碱基)或 AYBE(A-to-Y base editor,Y 代表 C 或 T),这个编辑器将腺嘌呤 A 突变为胞嘧啶 C 或胸腺嘧啶 T。上文讲过,一个位点切除碱基后,那个位点会空出一个无任何碱基的空位,这个空位为其他碱基替代提供了机会。这个道理同样适用于 ABE 系统。在 ABE 中, A 被脱氨后变成 I,如果把 I 的碱基(次黄嘌呤,hypoxanthine)切除后就能留出空位 (图 2)。但是没有能够直接切除次黄嘌呤的 DNA 糖基化酶,怎么办?
2023 年,有两组中国的科研团队找到了解决办法。一组是中国科学院上海神经研究所杨辉和临港实验室胥春龙及辉大基因治疗有限公司童华威等合作团队
【5】
,一组是华东师范大学李大力团队
【6】
。这两组团队的策略几乎一样:使用人的 N-甲基嘌呤 DNA 糖基化酶(MPG)
【5】
或小鼠的烷基腺嘌呤 DNA 糖基化酶(AAG)
【6】
(其实是同一种蛋白,能切除嘌呤类碱基),用这个蛋白来切除次黄嘌呤。
为了提高切除次黄嘌呤的效率和腺嘌呤编辑效率,他们分别通过理性突变和 AlphaFold 辅助预测指导的突变,改造出 MPG/AAG 蛋白变体,与 ABE 蛋白融合后,可以高效切除 I 中的次黄嘌呤碱基,实现了 A-to-C 或 A-to-T 碱基替代编辑(图 2),并进行一系列优化后获得了较高的编辑效率 (最高可达到 70% 以上),其中 A-to-C 的编辑效率高于 A-to-T。因此,第四种碱基编辑器 AXBE 和 AYBE 实现了嘌呤(A)到嘧啶(C or T)的颠换。
图 2. AYBE 原理(引自【5】)
第五种碱基编辑器 gGBE
虽然,上述四种碱基编辑器分别实现了碱基转换和颠换,但是只能编辑 C 和 A,而且都需要脱氨这个中间步骤。第四种碱基编辑器的意义在于,它不仅实现了嘌呤到嘧啶的颠换(A-to-C/T),同时也发掘了脱嘌呤酶(如 MPG/AAG)的潜力,这为鸟嘌呤 G 的编辑提供了可能的方案。
2023 年,童华威和杨辉团队仍然以可以切除嘌呤类碱基的 MPG 为基础,通过理性突变筛选可以切除鸟嘌呤的 MPG 变体,与 nCas9(Cas9 nickase) 融合,构建出无需脱氨酶、只用糖基化酶就可实现鸟嘌呤编辑的第五种碱基编辑器-gGBE(glycosylase-based guanine base editor)(图 3)
【7】
。gGBE 的编辑产物是 G-to-Y(T/C),其中 G-to-C 的比例高于 G-to-T。gGBE 在人细胞和小鼠胚胎中的编辑效率最高可达到 81.2%,其中 G-to-Y 转化率最高达到 95%
【7】
。
图 3. gGBE 原理(引自【7】)
至此,从 2016 年到 2023 年,已经依次实现了 C、A、G 三种碱基的编辑,只剩下最后一个碱基 T 了。
第六种碱基编辑器 TBE
不同于前三种碱基,T 既不能脱氨(没有氨基),也不能脱嘌呤(不是嘌呤)。好在第五种编辑器 gGBE 不仅实现了对碱基 G 的编辑,而且第一次提出了无脱氨酶的碱基编辑策略,也就是,只要用 DNA 糖基化酶切除碱基,那么就可能通过碱基切除修复来实现任何碱基的编辑。
2024 年,来自中国的 4 个科研团队开发出了针对碱基 T 的编辑器,他们命名的名称各有不同,这里统一称为 TBE(thymine base editor )。这四个团队分别是天津工业生物技术研究所毕昌昊/张学礼团队(DAF-TBE)
【8】
、复旦大学常兴团队(TSBE)
【9】
、辉达基因的杨辉/周英思/童华威团队(gTBE)
【10】
、清华大学魏文胜团队 (TBE)
【11】
。这个四个团队的共同策略是以尿嘧啶-DNA 糖基化酶(UNG)为基础,将 UNG 改造成可以切除 T 的胸腺嘧啶-DNA 糖基化酶。不过这四个团队改造 UNG 的路线有所不同,毕昌昊/张学礼团队采用的是随机突变,杨辉等人团队和魏文胜团队采用的是蛋白结构指导的理性突变,常兴团队采用的是蛋白质语言模型辅助预测。改造的 UNG 与 nCas9 融合,再经过一系列优化后,实现了 T 的碱基编辑,在细胞中的编辑效率最高可达到 50% 以上(主要是 T-to-S(G/C),也有一定比例的 T-to-A,但四组团队的结果有所差异)(图 4)。
采用类似策略,他们还开发出了无脱氨酶而只依赖 DNA 糖基化酶的胞嘧啶编辑器 gCBE(图 4),并通过比较,发现编辑效率与第三种编辑器 CGBE 大致类似,或者在某些位点的效率高于 CGBE。不过,以 DNA 糖基化酶为基础的碱基编辑器无需脱氨步骤,因此有潜力降低脱氨导致的脱靶以及其他非预期编辑。
但是,与经典 ABE 和 CBE(见上篇推文)的碱基脱氨编辑法相比,以 DNA 糖基化酶为基础的编辑方法在靶点产生 Indel 的频率比较高,这说明糖基化酶切除碱基后可能导致一定程度的 DNA 双链断裂(不想要的结果)。而且,不同于 ABE 和 CBE,基于糖基化酶的编辑策略所产生的编辑产物纯度不高(即,编辑产物不是单一碱基,比如 T 既可能变成 G,也可能变成 C,还可能变成 A)。由于以糖基化酶为基础的碱基编辑方法属于初创,因此该方法还需要进一步优化。