专栏名称: 生物制品圈
资源分享,行业交流!
目录
相关文章推荐
生物制品圈  ·  肽类药物:现状、进展与未来展望 ·  3 天前  
BioArt  ·  Nat Chem Biol | ... ·  2 天前  
生信人  ·  永不过时的热点:铁死亡 ·  4 天前  
生物制品圈  ·  百利天恒,双抗 ADC 技术 ... ·  4 天前  
51好读  ›  专栏  ›  生物制品圈

mRNA序列设计|编码区序列(CDS)设计与优化全解析

生物制品圈  · 公众号  · 生物  · 2025-02-14 11:50

正文

mRNA 序列设计是 mRNA 疫苗 / 药物开发的第一难关,序列骨架直接影响 mRNA 的稳定性、翻译效率和免疫原性等,是 mRNA 成功开发的关键决策之一。

mRNA由编码区域( CDS )和非编码区域( 5' cap 5' UTR 3' UTR 3' poly A 尾)构成。其中编码区决定了经 mRNA 递送的功能性蛋白的成药潜力。本期文章菌菌将聚焦于 CDS 编码序列,结合 mRNA 巨头公司 Moderna BioNTech/ 辉瑞、 Arcturus 等实际应用案例解析其设计与优化策略。



01

mRNA序列全解析

5’ Cap 的作用是保护 mRNA 不被外切酶降解、维持其结构稳定性,并与 3’ 端的 poly A 尾、 poly A 结合蛋白( PAPB )和翻译起始因子蛋白协同作用,起始蛋白质的翻译。出于真核生物体内表达的考虑, mRNA 常用的帽结构为 Cap1 IVT mRNA 常用的加帽方式包括酶法加帽和共转录加帽。

5’ UTR 3’ UTR 的功能为调控 mRNA 的翻译,影响 mRNA 的稳定性。在 mRNA 疫苗 / 药物的研发过程, UTR 的设计原则为:直接选取人高表达基因的 mRNA 、使用病毒来源 UTR 、或基于算法全新设计 UTR 序列。

如前所述, poly A 尾与 Cap 结构、 poly A 尾结合蛋白( PAPB )协同起始 mRNA 的翻译程序。已被证明有效的 polyA 序列包括长度在 100~120 nt 的纯 A 序列、或分段式 polyA 序列(例如辉瑞 /BioNTech 30A + 10(GCAUAUGACU) + 70A )。

除以上非编码的元件外,编码区域( CDS )的可翻译率无疑是至关重要的。 CDS 的设计和优化策略为:首先确定目标蛋白的氨基酸序列(天然蛋白序列或具有增强功能的突变体),其次是针对目标物种进行密码子优化。

下文中菌菌将结合典型案例分析 mRNA CDS 的设计与优化,主要包括两个步骤:首先是设计目标蛋白氨基酸序列,再基于密码子设计并优化 mRNA CDS 序列。

图示 mRNA 序列设计原则


02

编码蛋白的氨基酸序列设计与优化

mRNA CDS序列的设计基础是 确定目标蛋白的氨基酸序列 。氨基酸排列顺序是蛋白质一级结构和高级结构的基础,直接决定蛋白质的生物学功能。天然活性蛋白的氨基酸序列是 CDS 序列设计的可选方案之一。

然而,随着蛋白质工程的成熟发展,筛选或定向改造具有增强功能的突变体能够进一步改善蛋白或多肽分子的成药特性。这一工程化设计思维也逐渐应用于 mRNA CDS 序列的设计,相关典型案例如下:

案例 1 :报告基因 eGFP

绿色荧光蛋白( GFP, green fluorescent protein )来源于水母 Aequorea victoria ,能够在原核和真核生物体内表达荧光蛋白。 2008 年,发现和发展 GFP 蛋白的三位科学家 Osamu Shimomura Martin Chalfie Roger Tsien (钱永健)被授予了诺贝尔化学奖。

然而 GFP 发光信号较弱,科学家发现了一种 GFP 突变体,得到了增强型绿色荧光蛋白( eGFP, enhanced green fluorescent protein )。相比天然版本的 GFP eGFP 的荧光强度提高了 35 倍。

目前, eGFP mRNA 已成为 mRNA 研究领域必不可缺的工具,用于细胞转染对照、 mRNA 序列优化、目标蛋白示踪以及递送系统开发。

图示 耀海 RNASci 平台 eGFP mRNA 的细胞转染评估

报告基因 mRNA 的使用对于 LNP 递送系统的开发至关重要,例如:绿色荧光蛋白 mRNA 、红色荧光蛋白 mCherry mRNA 、荧光素酶 mRNA Luciferase mRNA )等。 耀海生物 RNASci 平台提供多种报告基因 mRNA (转染级和高纯度级),在体内外均具备高表达水平,高质量满足 mRNA 的细胞转染和动物试验需求。欢迎垂询: 13380332910

案例 2 Moderna mRNA-3705 h M MUT 多态性)

基因 / 蛋白的多态性 也是目标蛋白氨基酸序列选择的考量之一。

mRNA-3704 mRNA-3705 Moderna 开发的针对甲基丙二酸血症 / 酸尿症( MMA )的管线, MMA 最常见的致病因素是甲基丙二酰辅酶 A 变位酶( MMUT )缺陷或缺失。

mRNA-3704 mRNA-3705 均编码人 MMUT ,二者的区别在于, mRNA-3704 的第 671 位氨基酸是缬氨酸( V671 ),而 mRNA-3705 671 位氨基酸替换为异亮氨酸( I671 )。 mRNA-3705 的编码序列的来源为健康人群 MMUT 671 位点的多态性。

图示 Moderna mRNA-3704/3705 的序列示意图

案例 3 Arcturus ARCT-810 OTC 突变体)

参考蛋白 / 多肽药物的开发,设计一种蛋白突变体以改善其半衰期等性能,也是 mRNA 上游设计中的重要步骤。

ARCT-810 Arcturus 的在研管线,靶点为鸟氨酸氨甲酰转移酶( OTC ),针对鸟胺酸氨甲酰基转移酶缺乏症( OTCD )。 ARCT-810 通过专有脂质纳米颗粒( LNP )将 mRNA 递送到细胞中, mRNA 被翻译成功能性的 OTC ,使患者自身肝细胞产生具有生物学功能的 OCT 酶。相比野生型 OCT 酶, ARCT-810 存在 3 个氨基酸位点的改变,从而提高了 OTC 的半衰期,且增加了与线粒体的结合。

图示 Arcturus ARCT-810 序列示意图

案例 4 ReCode RCT2100 CFTR 突变体)

囊性纤维化( CF )是由囊性纤维化跨膜传导调节器( CFTR )基因突变引起的疾病,会导致患者进行性气道损伤和呼吸衰竭。 ReCode 正在开发一款基于 mRNA 蛋白替代疗法的管线—— RCT2100 RCT2100 编码 CFTR mRNA ,利用选择性器官靶向( SORT LNP 通过雾化器吸入给药,将 mRNA 特异性递送至与疾病有关的器官、组织和细胞。

RCT2100 mRNA 编码区经过了优化。野生型 CFTR 蛋白存在一个特定的水解热点,而 ReCode 优化后的 CFTR mRNA 相比野生型的水解热点明显减少,有效维持 mRNA 的稳定性和翻译效率。

图示 ReCode RCT2100 序列示意图


03

mRNA CDS序列的设计与优化

基于以上策略确定了目标蛋白的氨基酸序列,下一步是针对氨基酸序列设计优化 mRNA 序列,常用的策略为密码子优化。据报道,两种密码子优化策略(复合密码子家族优化和家族内密码子优化)已成功用于商业化 mRNA 疫苗 CDS 区的优化,包括 Moderna 新冠疫苗 mRNA-1273 BioNTech/ 辉瑞疫苗 BNT-162b2

当前主要以 CAI (密码子适应指数)作为密码子优化的参数。经密码子优化后, mRNA-1273 CAI 约为 0.9 8 BNT-162b2 CAI 约为 0.9 5 ,二者均相比天然新冠病毒 S 蛋白编码基因( CAI 0.7 )大幅提高。

3.1 复合密码子家族 优化

对于精氨酸( Arg )编码基因来说,人体内使用 CGN 的频率高于 AGR 。然而,在病毒基因组内却恰恰相反。例如,新冠病毒的刺突蛋白包含 42 Arg 残基,其中 30 个由 AGR 密码子编码,仅 12 个由 CGN 密码子编码。

mRNA 疫苗的 CDS 序列优化方面,辉瑞 /BioNTech 采用了典型的复合密码子优化策略,在 BNT162b2 CDS 区域减少了 8 AGR 密码子,对应增加了 CGN 密码子的频率。 Moderna 开发的 mRNA-1273 也使用了这一策略,将其中 28 AGR 密码子替换成了 CGN

类似地,高表达的人核糖体蛋白中, 81% 的亮氨酸通过 CUN 密码子编码。因此,在 mRNA 疫苗 BNT162b2 mRNA-1273 中,多数的 UUR 被替换为 CUN

3.2







请到「今天看啥」查看全文