本文内容速览:
在植物基因功能研究中,作为“主角”的编码区(Coding DNA sequence,CDS)一直是研究所关注的重点,而作为“配角”的非翻译区(Untranslated region,UTR)往往被忽视,受到的关注也相对较少,甚至有时被认为是可有可无的序列。随着基因功能的研究越来越深入与全面,UTR在基因表达调控中的重要作用逐渐被揭示,尤其是在应答特定环境和发育过程中的重要作用。因此,UTR不仅仅只是简单的非编码序列,它也包含着丰富的调控信息,这些信息对基因的转录后调控起着至关重要的作用。本文旨在分享UTR的相关内容,尤其是
UTR
中的一些重要调控序列
如
开放阅读框
(Open reading frame,ORF)的功能,希望完善大家对UTR的认知。
UTR是指位于mRNA两端的非编码序列,分为
5' UTR
和
3' UTR
。5' UTR位于起始密码子之前,而3' UTR则位于终止密码子之后。总体来说,UTR的功能主要体现在其对mRNA的
翻译调控
、
稳定性
及
亚细胞定位
等方面。在特定条件下,UTR中的调控元件可以通过影响核糖体的加载、mRNA的降解和转运等途径,精细调控基因表达的时间和空间模式。具体来说,5' UTR通常包含
影响翻译效率的顺式作用元件
,如
上游开放阅读框
(Upstream open reading frame,uORF)、
内部核糖体进入位点
(Internal ribosome entry site,IRES)、
G-
四链体
(RNA G-quadruplex,RG4)及具有复杂二级结构的
发卡环
(Hairpin)等。这些结构通过调控核糖体的结合效率、翻译起始以及mRNA的局部稳定性,精细调节下游编码区的蛋白质合成(图1B-E)。3' UTR则更侧重于对
mRNA
的
翻译
调控
、
稳定性
及
亚细胞定位
的调控。3' UTR中通常包含
A
U
富集元件
(AU-rich element,ARE)、
miRNA
结合位点
、
细胞内定位信号
以及
RG4
等调控元件,这些元件通过调节mRNA的降解速率、翻译抑制和亚细胞定位,在基因表达的精细调控中发挥重要作用(图1F-I)(Hardy et al., 2024)。接下来,小远将列举相关文献案例介绍5' UTR和3' UTR中重要元件的调控机制。
图1 UTR中的重要调控元件(Hardy et al., 2024)。(A)mRNA模式图及其UTR上的重要调控元件;(B-I)UTR上重要调控元件所参与分子调控过程的示意图。
uORF广泛分布于植物基因组上,18~57%的基因都含有uORF。由于非常规起始密码子(非AUG)存在等原因,实际uORF的存在比例可能更高。
uORF
的种类共有三种
,分别是不与mORF(uORF下游的主开放阅读框,有时可理解为CDS)重叠的uORF、与mORF部分重叠的uORF以及包含mORF的uORF(图2)(Niu et al., 2
020)。这三种中最主要的还是第一种uORF。对于这种广泛存在的
序列
,其功能主要是
抑制
mORF
的翻译或引起
mRNA
的降解
,此外也可以
促进
mORF
翻译以及翻译成小肽
(Wang et al., 2023)。对于uORF翻译成小肽的过程在往期推文“
个头小,作用大——植物中的小肽
”中有所介绍,对小肽感兴趣的读者可以
阅读
回顾。近年来,随着基因编辑的发展,这使得对uORF的深入研究
成为可能,此外鉴于uORF在育种中的潜力和前景,uORF在植物中的研究也愈来愈火热,相关文章也不断增多。接下来就给大家分享一篇关于植物中uORF的研究论文。
图2 uORF的三种类型(Niu et al., 2020)。
在往期推文“
基因敲高——通过基因编辑改善作物农艺性状
”中介绍了对uORF进行编辑实现基因敲高的目的。相反地,是否可以人为地通过基因编辑引入uORF实现基因敲低的目的呢?
2023年3月,中国科学院遗传与发育生物学研究所高彩霞课题组在
Nature Biotechnology
杂志上发表了一篇题为“Tuning plant phenotypes by precise, graded downregulation of gene expression”的研究论文。因为已有研究发现
OsBRI1
的突变会导致水稻叶片夹角变小等表型(Morinaka et al., 2006),所以这篇论文中以
OsBRI1
(植物激素油菜素内酯受体编码基因)为研究对象。通过引导编辑的方法在
OsBRI1
的5' UTR区域定向突变生成了一个ATG,相当于人为引入了一个uORF(图3A)。后续实验发现,相较于野生型,uORF
OsBRI1
(-99
bp
, 28 aa,
uORF起始于
OsBRI1
mORF起始密码子-99bp的位置,肽段长度为28个氨基酸
)突变体中
OsBRI1
的表达量没有差异,但是蛋白丰度明显降低(图3B、C),这说明人为引入uORF确实导致了
OsBRI1
翻译水平降低。进一步观察表型发现uORF
OsBRI1
(−99
bp
, 28 aa)突变体与已报道的
OsBRI1
突变后表型类似(图3D)(Xue et al., 2023)。这些结果说明,可以通过引入uORF可以抑制基因的翻译。
图3 通过引导编辑引入uORF实现基因敲低(Xue et al., 2023)。(A)在
OsBRI1
的5' UTR区域引入ATG;(B)野生型和
uORF
OsBRI1
(−99
bp
, 28 aa)突变体中
OsBRI1
的mRNA水平比较;(C)野生型和
uORF
OsBRI1
(−99
bp
, 28 aa)突变体中
OsBRI1
的蛋白水平比较;(D)野生型和
uORF
OsBRI1
(−99
bp
, 28 aa)突变体叶夹角表型
观察。
在介绍IRES之前,先给大家分享一下真核生物mRNA翻译的起始过程。翻译的起始过程非常复杂,涉及一系列蛋白及复合体,其中两个十分重要的复合体分别是
eIF4F
复合体
和
43S PIC
复合体
。在mRNA准备翻译时,eIF4F复合体中的eIF4E(mRNA 5' -帽结合亚基)结合在mRNA的m
7
G帽子上,随后eIF4F复合体招募43S PIC复合体。43S PIC复合体紧接着向mRNA 3'端扫描起始密码子,扫描到起始密码子后具有翻译能力的核糖体正式形成,这也标志着翻译的起始的结束和延伸的开始(Bhat et al., 2015)。此外值得注意的是,这个过程中poly(A)结合蛋白(Poly(A)-binding protein,PABP)能与相关复合物结合以稳定转录起始。
图4 翻译起始过程(Bhat et al., 2015)。
从上面的描述中可以发现,对于真核生物翻译起始过程来说m
7
G帽子必不可少。那么真核生物是否所有翻译过程都需要m
7
G帽子呢?2022年7月,杜克大学董欣年课题组在
Cell
杂志
上发表了一篇题为“PABP/purine-rich-motif as an initiation module for cap-independent translation in pattern-triggered immunity”的研究论文,该研究发现在病原菌侵染条件下,脱帽蛋白(Decapping protein,DCP)会去除mRNA
上的
m
7
G
帽子,这会导致mRNA的降解。正常来说mRNA的降解会导致
抗病相关蛋白
的丰度下降,从而使植物表现出感病。然而有研究发现
DCP
的过表达并不会导致植物感病,这说明在生物胁迫时某些抗病基因的翻译并不会受到mRNA脱帽的影响(Yu et al., 2019)。作者进一步探索发现,在这些不受脱帽影响的mRNA的
5' UTR
存在富含嘌呤的R基序(R-motif),通过实验证明R-motif招募翻译起始的必须组分(PABP、eIF4G和植物中eIF4G的异构体eIFiso4G)后正常启动抗病基因的翻译过程,因此这些R-motif可以充当
IRES
的作用(简单来说就是不
需要m
7
G帽子也可以招募核糖体等翻译的必须组分从而启动翻译过程)。这一过程涉及病原体侵染信号的转递以及PABP、eIF4G和eIFiso4G的磷酸化(Wang et al., 2022)(图5),对详细过程感兴趣的读者可以阅读原文。
图5 IRES调控mRNA翻译过程的模式图(Wang et al., 2022)。
对于3' UTR中的调控元件,伯小远本想首先给大家讲述miRNA的结合位点,因为研究miRNA对mRNA的调控,一般会关注miRNA在3' UTR上的结合位点,该内容在往期推文“
基因敲高——通过基因编辑改善作物农艺性状
”有所涉及,在此就不重复分享。因此,这里就首先给大家分享ARE这种“低调”但也十分重要的调控元件。
ARE是一种位于mRNA 3' UTR中的调控元件。ARE由
富含腺嘌呤(A)和尿嘧啶(U)的短序列
组成,典型的ARE通常包含多个
AUUUA重复序列
。这些元件的长度和确切序列可能有所不同,但它们通常富含AU两种核苷酸。ARE通常通过与特定的RNA结合蛋白相互作用,形成RNA-蛋白复合物从而
调节mRNA稳定性和翻译
等过程(Goss and Domashevskiy, 2016)。下面是一篇关于植物中ARE的文章。
2023年1月,福建农林大学马留银课题组联合苏州大学吴小惠课题组在
Plant Physiology
杂志上发表了一篇题为“Alternative 3' UTRs regulate high salt tolerance of
Spartina alterniflora
”的研究论文,该研究前期发现盐胁迫下离子转运相关基因的3' UTR会延长,这提高了这些基因mRNA的稳定性和蛋白的丰度。为了深入探索这一现象的内在分子机制,作者以这些离子转运相关基因中的
SaHKT1
为突破口,分析
SaHKT1
3' UTR发现,盐胁迫下
SaHKT1
延长的3' UTR中发现了ARE,而未胁迫下
SaHKT1
的3' UTR未见ARE,这说明ARE可能对
SaHKT1
提高mRNA稳定性以响应盐胁迫至关重要。通过实验证明29nt ARE的缺失确实会导致SaHKT1蛋白丰度的下降(Wang et al., 2023)(图6)。
图6 互花米草中ARE提高mRNA稳定性以响应盐胁迫的模式图(Wang et al., 2023)。
RNA的G-四链体(RNA G-quadruplex,RG4)是一种由
富含鸟嘌呤(
G
)的序列
形成的特殊二级结构。在RNA分子中,G-四链体通过碱基堆积和配位离子的稳定,形成由四个G通过氢键连接成的平面结构。多个这样的平面可以堆叠在一起,形成稳定的四链结构(
Kwok
and
Merrick
, 2017)。3' UTR中的RG4参与
调控
mRNA
的定位以及稳定性
等,值得一提的是该结构也存在于5' UTR(
Fay
et al., 2017)。相比于ARE,RG4更加“冷门”,接下来与各位读者分享一篇有关植物中G-四链体的文章。
2022年10月,中科院分子植物科学卓越创新中心杨小飞课题组、东北师范大学张铧坤课题组联合约翰英纳斯中心丁一倞课题组在
Nature Communications
杂志上发表了一篇题为“RNA G-quadruplex structure contributes to cold adaptation in plants”的研究论文,该论文前期研究发现冷胁迫诱导了RG4的形成,所以作者猜测RG4可能在低温感知中发挥特别的作用,这种作用很可能是抑制mRNA的降解。为了进一步探索,作者选择了一个受低温显著诱导的基因
CORG1
为研究对象,将
CORG1
RG4中的G突变为A后获得
mutRG4-CORG1
突变体。实验后发现,冷胁迫条件下,
mutRG4-CORG1
突变体中
CORG1
mRNA的降解速率高于野生型,此外,
mutRG4-CORG1
突变体的生长抑制弱于野生型。这些说明RG4结构通过抑制mRNA的降解从而提高了植物对冷胁迫敏感度(Yang et al., 2022)。
图7 RG4通过抑制mRNA的降解提高植物对冷胁迫敏感度的模式图(Yang et al., 2022)。
3' UTR上的重要调控元件除了上面介绍的两种之外,比较常见的还有
m
6
A
修饰位点。具体来说,
m
6
A
指的是
RNA
分子中的腺苷(
A
)碱基的
N6
位点上附加一个甲基团(
-CH
3
)
。
m
6
A
是真核生物mRNA上含量最高的化学修饰,在
基因表达调控
中起着重要作用,包括
转录
和
转录后调控
(Tang et al., 2023)。相比于动物,植物中
m
6
A
修饰位点主要位于3' UTR,而5' UTR和CDS上较少(Wang et al., 2024)。3' UTR及CDS上的
m
6
A
修饰主要与mRNA的稳定性有关,而5' UTR上的
m
6
A
修饰是否与翻译效率有关还存在争议。最近有研究发现,单个
m
6
A
在5' UTR中对翻译效率没有明显影响。
由于
3'
UTR上的
m
6
A
修饰比较常见,在此处讨论植物上的
m
6
A
的修饰还是主要把目光集中在3' UTR上。
2018年4月,北京大学贾桂芳课题组在
Plant Cell
杂志上发表了一篇题为“The m6A Reader ECT2 Controls Trichome Morphology by Affecting mRNA Stability in Arabidopsis”的研究论文,作者发现
m
6
A
结合蛋白ECT2主要富集在mRNA的3' UTR上,进一步探究发现3' UTR的m
6
A修饰可以提高毛状体形态发生相关基因mRNA的稳定性(Wei et al., 2018)。
图8 3' UTR的
m
6
A
修饰提高毛状体形态发生相关基因mRNA稳定性的模式图(Wei et al., 2018)。
本小节
给大家分享了一些UTR上重要调控元件的相关研究,这些元件里有些已经逐渐走进了科研“舞台”的中心,如uORF等,而有些还徘徊在科研“舞台”的边缘,如RG4等。通过分享的文献案例大家可以了解到,这些元件在mRNA的
翻译调控
、
稳定性
及
亚细胞定位
相关过程中都起着重要的调控作用,由于篇幅有限的原因,并没有给大家列举所有调控元件的相关案例,例如,mRNA的定位可由RNA结合蛋白(RNA-binding proteins,RBPs)所介导,结合位置通常位于UTR和CDS(Tian et al.,2020),感兴趣的小伙伴可以自行查阅相关资料。
在植物基因功能研究过程中,研究人员通常通过基因敲除、基因沉默或过表达来调控特定基因的表达。然而,阅读本文后,相信大家也能意识到调控UTR区也是一种行之有效的方法。当实验仅需要基因敲除或过表达时,传统方法可能已经足够,但如果要求
不改变编码序列且不引入外源片段
,就需要考虑其他策略。通过改造UTR区中的重要调控元件,不仅可以满足要求,还可以实现基因的上调及下调,这对品种改良和实际推广具有重要意义。总之,随着基因编辑技术的发展和基础研究的进步,越来越多的优良基因被发现。为了将这些基因应用于实际育种中,UTR区中的重要调控元件将成为一个重要的突破口。
Bhat M, Robichaud N, Hulea L, et al. Targeting the translation machinery in cancer[J].
Nature reviews Drug discovery
, 2015, 14(4): 261-278.
Fay M M, Lyons S M, Ivanov P. RNA G-quadruplexes in biology: principles and molecular mechanisms[J].
Journal of molecular biology
, 2017, 429(14): 2127-2147.
Goss D J, Domashevskiy A V. Messenger RNA (mRNA): The link between DNA and protein[J].
Encyclopedia of Cell Biology
, 2016.
Hardy E C, Balcerowicz M. Untranslated yet indispensable—UTRs act as key regulators in the environmental control of gene expression[J].
Journal of Experimental Botany
, 2024: erae073.
Kwok C K, Merrick C J. G-quadruplexes: prediction, characterization, and biological application[J].
Trends in biotechnology
, 2017, 35(10): 997-1013.
Morinaka Y, Sakamoto T, Inukai Y, et al. Morphological alteration caused by brassinosteroid insensitivity increases the biomass and grain production of rice[J].
Plant physiology
, 2006, 141(3): 924-931.
Niu R, Zhou Y, Zhang Y, et al. uORFlight: a vehicle toward uORF-mediated translational regulation mechanisms in eukaryotes[J].
Database
, 2020, 2020: baaa007.
Tang J, Chen S, Jia G. Detection, regulation, and functions of RNA N6-methyladenosine modification in plants[J].
Plant communications
, 2023, 4(3).
Tian L, Chou H L, Fukuda M, et al. mRNA localization in plant cells[J].
Plant physiology
, 2020, 182(1): 97-109.
Wang G, Li H, Ye C, et al. Quantitative profiling of m6A at single base resolution across the life cycle of rice and Arabidopsis[J].
Nature Communications
, 2024, 15(1): 4881.
Wang J, Liu J, Guo Z. Natural uORF variation in plants[J].
Trends in Plant Science
, 2023.
Wang J, Zhang X, Greene G H, et al. PABP/purine-rich motif as an initiation module for cap-independent translation in pattern-triggered immunity[J].
Cell
, 2022, 185(17): 3186-3200. e17.
Wang T, Ye W, Zhang J, et al. Alternative 3′-untranslated regions regulate high-salt tolerance of
Spartina alterniflora
[J].
Plant Physiology
, 2023, 191(4): 2570-2587.
Wei L H, Song P, Wang Y, et al. The m6A reader ECT2 controls trichome morphology by affecting mRNA stability in Arabidopsis[J].
The Plant Cell
, 2018, 30(5): 968-985.
Xue C, Qiu F, Wang Y, et al. Tuning plant phenotypes by precise, graded downregulation of gene expression[J].
Nature Biotechnology