2020
年
10
月,基于
CRISPR-Cas9
系统建立的基因组编辑技术获得了
“2020
年度诺贝尔化学奖
”
。实际上,这一革命性生物技术起源于科学家们对微生物中一种特殊的免疫系统(即
CRISPR-Cas
系统)的研究。
CRISPR-Cas
系统是在原核微生物(古菌和细菌)中广泛存在的抗病毒(噬菌体)免疫系统。宿主菌通过将入侵病毒的特定
DNA
序列插入到其
CRISPR
结构中,可形成对该病毒的永久性“记忆”。这些记忆性序列(称为
spacer
)可转录加工生成
crRNA
、指导
CRISPR-Cas
系统效应物(如
Cas9
或
Cascade
复合物)特异性识别和切割再次入侵的病毒,实现对该类病毒的适应性免疫。
CRISPR-Cas
系统丰富多样的功能组分和核酸靶向机制,为人类提供了迄今最高效的基因组编辑技术(如
CRISPR-Cas9
系统)和基因检测技术(如
CRISPR-Cas13a
系统),因此近十余年来一直是生命科学研究的前沿。
CRISPR-Cas
系统在微生物基因组中稳定性维持是其抗病毒功能实现的关键基础。一方面,
CRISPR-Cas
系统具有自我免疫的风险,并可能阻碍有益外源基因的获取,因此可对宿主细胞造成适合度代价(
fitness cost
)而可能在进化过程中频繁丢失。另一方面,微生物宿主与其病毒的“军备竞赛”中,
CRISPR-Cas
系统也会成为病毒反攻(
Anti-CRISPR
)的目标而丧失功能。面对多重的进化压力和适应性挑战,
CRISPR-Cas
系统为何能在微生物中广泛存在(存在于约
90%
的古菌和
40%
细菌中)并发挥其功能?在微生物宿主基因组中是否存在一类保护
CRISPR-Cas
功能但至今尚未被揭示的
“
暗物质
”
?这是科学家长期关注而又未能充分认识的前沿科学问题。
2021
年
4
月
30
日,国际顶级期刊
Science
以长文形式(
ResearchArticle
)在线发表了中国科学院微生物研究所向华
/
李明团队的最新研究成果
“Toxin-antitoxin RNA pairs safeguard CRISPR-Cassystems”
(
Li
M
. et al., Science 372, eabe5601
,
DOI:10.1126/science.abe5601
)。他们首次在自然界分布最广泛的
I
型
CRISPR-Cas
基因簇内部发现了一类特殊的
RNA“
暗物质
”
:一类前所未见的对其偶联的
CRISPR-Cas
系统具护卫功能的一对
RNA
的毒素
-
抗毒素(
CreTA
)系统。由于
CRISPR-Cas
系统可利用
RNA
抗毒素
CreA
控制
RNA
毒素
CreT
的表达,使宿主菌无法丢失其
CRISPR-Cas
系统(对其“上瘾”)。因为一旦
CRISPR-Cas
组分被破坏,就会诱导
CreT
毒素的表达,从而抑制甚或杀死该宿主菌(图
1
),从而保护了
CRISPR-Cas
系统在细胞群体中的稳定存在。
这一
“成瘾”机制的发现为理解
CRISPR-Cas
系统的稳定性维持和广泛性分布提供了全新视角,同时该文还揭示了一大类前所未知、功能多样的小
RNA
(曾被称为基因组中的“暗物质”
-Nat Rev Microbiol 12(2014):647
),开辟了一个全新的研究领域。
图
1. CRISPR-Cas
系统与
CreTA
毒素
-
抗毒素系统的互作机制
早在
2014
年,向华
/
李明团队即利用西班牙盐盒菌(
Haloarcula hispanica
)及其病毒在国际上建立了第一个
I
型
CRISPR
系统的高效适应模型,揭示了
CRISPR
系统对病毒高效适应需要引发的规律,并深入解析了“引发适应”过程精细的分子机制,包括
Cascade
与
crRNA
的可塑性。在这一研究过程中,他们发现了一个奇怪的现象
: 4
个成簇的编码
CRISPR
效应复合物
Cascade
的基因(
cas6-cas8-cas7-cas5
)无法单独敲除,但可以作为整体一起敲除,从而推测这个基因簇内部可能隐藏了一个未知的“细胞成瘾”元件。
经过近
7
年的探索,他们最终在
cas6
与
cas8
之间一段仅
311 bp
的基因间区内发现了一类全新的小
RNA
毒素
-
抗毒素系统,分别命名为
CreT
(
RNA
毒素)和
CreA
(
RNA
抗毒素)。
CreTA
通过与
CRISPR
效应复合物
4
个编码基因的结构与功能的偶联,守护了
CRISPR-Cas
系统的稳定性(图1)。
主要创新性发现:
1、首次发现受
Cascade
蛋白控制的小
RNA
毒素
该团队首先通过敲除
cas6
和
cas8
基因间区的
311 bp
序列获得
∆TA
菌株,然后基于该菌株成功获得了
Cascade
各单基因缺失菌株。接着,他们利用携带这一段
311 bp
基因间区的质粒(
pTA
)转化各突变株,发现在
Cascade
基因缺失(
∆
cas5-8
)或其单基因缺失
(∆TA∆
cas5/6/7/8
)
的菌株中,
pTA
均表现出细胞毒性(转化效率降低约
4
个数量级),而在
Cascade
基因完整表达的
∆TA
菌株中,
pTA
的细胞毒性则被完全抑制。上述系列实验表明,
311 bp
的基因间区产生了某种未知毒素,命名为
Cascade
抑制型毒素(
C
ascade-
re
pressed
T
oxin
),即
CreT
(图
2A
和
2B
)。
为确定
CreT
的具体序列,该团队通过截短实验发现
CreT
毒性来自于一段
132bp
的序列(图
2A
中
-54
到
+78
),其中有一个典型的启动子序列,可起始转录产生了一个
78nt
的小
RNA
。突变分析进一步表明,该启动子及小
RNA
内部一段茎环结构的突变均导致
CreT
毒性的消失(图
2C
),说明
CreT
是一种具有细胞毒性的小
RNA
分子。
CreT
的诱导表达实验进一步证明了其抑菌(
bacteriostatic
)而非杀菌(
bactericidal
)活性(图
2D
和
2E
)。
图
2 .
creTA
在
CRISPR-
cas
基因簇中的位置及功能分析
2、解析了小分子
RNA
毒素
CreT
独特的抑菌机制
对
CreTRNA
的精细序列和结构分析表明,其5
'
端具有强效的翻译信号
SD
(
Shine-Dalgarno
)序列和
AUG
起始密码,紧接其后的是两个精氨酸稀有密码子
AGA,
随后是终止密码子
UGA
和一个茎环结构(图3
A
)。系列突变实验表明,上述关键序列和结构都是
CreT
毒性所必需。基于此,该团队推断了一个全新的分子回路,即
CreT RNA
借助强效的翻译起始信号定位在核糖体上,然后通过两个串联的稀有密码子
AGA
进一步劫持胞内稀有的精氨酸
tRNA
UCU
,从而抑制了胞内其它重要蛋白的翻译合成和细胞生长。基于这一猜想,他们通过过表达
tRNA
UCU
成功解除了
CreT
的细胞毒性(图3
B
),证实了这一全新的毒性机制,即
CreT
是通过其
RNA
劫持胞内稀有的精氨酸
tRNA
发挥毒性,而非翻译产生含二精氨酸的小肽发挥作用,因此
CreT
是一类小
RNA
毒素。
图3
. CreT
毒素通过劫持胞内稀有的精氨酸
tRNA
UCU
抑制菌体生长
3、发现
CreA
抗毒素——类似
crRNA
的小分子
RNA
为揭示
Cascade
蛋白抑制
CreT
毒性的分子机制,该团队首先敲除了胞内唯一的
CRISPR array
结构,从而排除了
CRISPR array
来源的
crRNA
参与毒性抑制的可能性。对
311bp
基因间区的截短与突变实验表明,
creT
下游序列为毒性抑制所必需(图2
C
)。精细的序列分析和
Northern
印迹等实验表明,
creT
下游有一段与
CRISPRrepeat
高度相似的序列(图
2A
),该序列及其下游序列可独立转录产生一个约
90nt
的前体
RNA
,并被
Cas6
加工为一个的成熟的小
RNA
(图4
A
)。该小
RNA
约
41nt
,含有与
crRNA
一样的完整的
5' handle
序列(
8 nt
),特定的
spacer
序列
(
约
33nt)
,但缺乏
crRNA
常见的
3' handle
,因此命名为“类
crRNA
抗毒素”(
C
rRNA-
re
sembling
A
ntitoxin
),简称
CreA
。
CreA
作为
crRNA
类似分子,即可能联合
Cascade
蛋白对
CreT
毒素活性发挥抑制作用。
图4
.CreA
模拟
crRNA
指导
Cascade
特异性抑制
creT
启动子
4、揭示
CreA RNA
联合
Cascade
发挥抗毒素活性的分子机制
该团队进一步揭示,与
crRNA
介导
Cascade
复合物识别外源靶序列一样,
CreA
介导
Cascade
精确识别
creT
启动子(图
4B
)。
CreA
种子序列区(
5' handle
后约
11nt
)与
creT
启动子完全匹配(除不参与碱基匹配的第6个核苷酸外),而其余大部分序列不匹配。对
CreA
的
5' handle
序列和种子序列区的突变、以及对保守
PAM
(
protospacer adjacent motif
)序列的突变,都将导致
CreA
对
creT
启动子抑制活性的丧失,进一步证明
CreA
联合
Cascade
实现了对
CreT
的转录水平调控,从而在正常情况下可抑制
CreT
的表达及毒性。
特别需要指出的是,该团队早期实验已经揭示了
crRNA
的高度可塑性,其结构(如是否含有
3' handle
序列)及
spacer
与靶序列匹配长度的不同,可以指导
Cascade
对外源靶标
DNA
实现干扰或引发适应两种不同的生理效应。本研究进一步发现
CreA
与
creT
基因启动子序列之间的不完全匹配性指引了多亚基
Cascade
效应物结合并抑制毒素启动子的活性,从而实现对毒素基因的转录水平调控,
这在国际上首次揭示了多亚基
CRISPR
效应物固有的基因调控生理功能
。
5、揭示
CreTA
对
CRISPR-Cas
系统的护卫功能
通过研究在有无