5’
Cap
的作用是保护
mRNA
不被外切酶降解、维持其结构稳定性,并与
3’
端的
poly A
尾、
poly A
结合蛋白(
PAPB
)和翻译起始因子蛋白协同作用,起始蛋白质的翻译。出于真核生物体内表达的考虑,
mRNA
常用的帽结构为
Cap1
。
IVT mRNA
常用的加帽方式包括酶法加帽和共转录加帽。
5’
UTR
和
3’
UTR
的功能为调控
mRNA
的翻译,影响
mRNA
的稳定性。在
mRNA
疫苗
/
药物的研发过程,
UTR
的设计原则为:直接选取人高表达基因的
mRNA
、使用病毒来源
UTR
、或基于算法全新设计
UTR
序列。
如前所述,
poly A
尾与
Cap
结构、
poly A
尾结合蛋白(
PAPB
)协同起始
mRNA
的翻译程序。已被证明有效的
polyA
序列包括长度在
100~120 nt
的纯
A
序列、或分段式
polyA
序列(例如辉瑞
/BioNTech
的
30A + 10(GCAUAUGACU) + 70A
)。
除以上非编码的元件外,编码区域(
CDS
)的可翻译率无疑是至关重要的。
CDS
的设计和优化策略为:首先确定目标蛋白的氨基酸序列(天然蛋白序列或具有增强功能的突变体),其次是针对目标物种进行密码子优化。
下文中菌菌将结合典型案例分析
mRNA CDS
的设计与优化,主要包括两个步骤:首先是设计目标蛋白氨基酸序列,再基于密码子设计并优化
mRNA CDS
序列。
图示
mRNA
序列设计原则
mRNA CDS序列的设计基础是
确定目标蛋白的氨基酸序列
。氨基酸排列顺序是蛋白质一级结构和高级结构的基础,直接决定蛋白质的生物学功能。天然活性蛋白的氨基酸序列是
CDS
序列设计的可选方案之一。
然而,随着蛋白质工程的成熟发展,筛选或定向改造具有增强功能的突变体能够进一步改善蛋白或多肽分子的成药特性。这一工程化设计思维也逐渐应用于
mRNA CDS
序列的设计,相关典型案例如下:
案例
1
:报告基因
eGFP
绿色荧光蛋白(
GFP,
green fluorescent protein
)来源于水母
Aequorea victoria
,能够在原核和真核生物体内表达荧光蛋白。
2008
年,发现和发展
GFP
蛋白的三位科学家
Osamu Shimomura
、
Martin Chalfie
和
Roger Tsien
(钱永健)被授予了诺贝尔化学奖。
然而
GFP
发光信号较弱,科学家发现了一种
GFP
突变体,得到了增强型绿色荧光蛋白(
eGFP, enhanced
green fluorescent protein
)。相比天然版本的
GFP
,
eGFP
的荧光强度提高了
35
倍。
目前,
eGFP mRNA
已成为
mRNA
研究领域必不可缺的工具,用于细胞转染对照、
mRNA
序列优化、目标蛋白示踪以及递送系统开发。
图示
耀海
RNASci
平台
eGFP mRNA
的细胞转染评估
报告基因
mRNA
的使用对于
LNP
递送系统的开发至关重要,例如:绿色荧光蛋白
mRNA
、红色荧光蛋白
mCherry mRNA
、荧光素酶
mRNA
(
Luciferase
mRNA
)等。
耀海生物
RNASci
平台提供多种报告基因
mRNA
(转染级和高纯度级),在体内外均具备高表达水平,高质量满足
mRNA
的细胞转染和动物试验需求。欢迎垂询:
13380332910
。
案例
2
:
Moderna
mRNA-3705
(
h
M
MUT
多态性)
基因
/
蛋白的多态性
也是目标蛋白氨基酸序列选择的考量之一。
mRNA-3704
和
mRNA-3705
是
Moderna
开发的针对甲基丙二酸血症
/
酸尿症(
MMA
)的管线,
MMA
最常见的致病因素是甲基丙二酰辅酶
A
变位酶(
MMUT
)缺陷或缺失。
mRNA-3704
和
mRNA-3705
均编码人
MMUT
,二者的区别在于,
mRNA-3704
的第
671
位氨基酸是缬氨酸(
V671
),而
mRNA-3705
的
671
位氨基酸替换为异亮氨酸(
I671
)。
mRNA-3705
的编码序列的来源为健康人群
MMUT
在
671
位点的多态性。
图示
Moderna mRNA-3704/3705
的序列示意图
案例
3
:
Arcturus
ARCT-810
(
OTC
突变体)
参考蛋白
/
多肽药物的开发,设计一种蛋白突变体以改善其半衰期等性能,也是
mRNA
上游设计中的重要步骤。
ARCT-810
是
Arcturus
的在研管线,靶点为鸟氨酸氨甲酰转移酶(
OTC
),针对鸟胺酸氨甲酰基转移酶缺乏症(
OTCD
)。
ARCT-810
通过专有脂质纳米颗粒(
LNP
)将
mRNA
递送到细胞中,
mRNA
被翻译成功能性的
OTC
,使患者自身肝细胞产生具有生物学功能的
OCT
酶。相比野生型
OCT
酶,
ARCT-810
存在
3
个氨基酸位点的改变,从而提高了
OTC
的半衰期,且增加了与线粒体的结合。
图示
Arcturus
ARCT-810
序列示意图
案例
4
:
ReCode
RCT2100
(
CFTR
突变体)
囊性纤维化(
CF
)是由囊性纤维化跨膜传导调节器(
CFTR
)基因突变引起的疾病,会导致患者进行性气道损伤和呼吸衰竭。
ReCode
正在开发一款基于
mRNA
蛋白替代疗法的管线——
RCT2100
。
RCT2100
编码
CFTR mRNA
,利用选择性器官靶向(
SORT
)
LNP
通过雾化器吸入给药,将
mRNA
特异性递送至与疾病有关的器官、组织和细胞。
RCT2100
的
mRNA
编码区经过了优化。野生型
CFTR
蛋白存在一个特定的水解热点,而
ReCode
优化后的
CFTR mRNA
相比野生型的水解热点明显减少,有效维持
mRNA
的稳定性和翻译效率。
图示
ReCode RCT2100
序列示意图
基于以上策略确定了目标蛋白的氨基酸序列,下一步是针对氨基酸序列设计优化
mRNA
序列,常用的策略为密码子优化。据报道,两种密码子优化策略(复合密码子家族优化和家族内密码子优化)已成功用于商业化
mRNA
疫苗
CDS
区的优化,包括
Moderna
新冠疫苗
mRNA-1273
和
BioNTech/
辉瑞疫苗
BNT-162b2
。
当前主要以
CAI
(密码子适应指数)作为密码子优化的参数。经密码子优化后,
mRNA-1273
的
CAI
约为
0.9
8
,
BNT-162b2
的
CAI
约为
0.9
5
,二者均相比天然新冠病毒
S
蛋白编码基因(
CAI
<
0.7
)大幅提高。
3.1
复合密码子家族
优化
对于精氨酸(
Arg
)编码基因来说,人体内使用
CGN
的频率高于
AGR
。然而,在病毒基因组内却恰恰相反。例如,新冠病毒的刺突蛋白包含
42
个
Arg
残基,其中
30
个由
AGR
密码子编码,仅
12
个由
CGN
密码子编码。
在
mRNA
疫苗的
CDS
序列优化方面,辉瑞
/BioNTech
采用了典型的复合密码子优化策略,在
BNT162b2
的
CDS
区域减少了
8
个
AGR
密码子,对应增加了
CGN
密码子的频率。
Moderna
开发的
mRNA-1273
也使用了这一策略,将其中
28
个
AGR
密码子替换成了
CGN
。
类似地,高表达的人核糖体蛋白中,
81%
的亮氨酸通过
CUN
密码子编码。因此,在
mRNA
疫苗
BNT162b2
和
mRNA-1273
中,多数的
UUR
被替换为
CUN
。
3.2