RNA分子作为生命体内重要的生物大分子,其结构多样性和动态性直接决定了其功能。近年来,RNA因其在基因调控、新型生物技术开发以及药物设计中的潜在应用引起了广泛关注。然而,由于RNA分子通常具有异质性和高度动态性,现有的主流结构解析技术如核磁共振
(NMR)
、X射线晶体学及冷冻电子显微镜
(Cryo-EM)
难以全面揭示RNA的动态构象。同时,现有的研究中缺乏大型RNA结构数据库,RNA序列和结构间的直接关联尚不明确。用于预测蛋白质结构的方法如AlphaFold也无法应用于RNA的三维结构预测。
近日,美国国家癌症研究所的
Yun-Xing Wang
教授在
Nature
发表了题为
The conformational space of RNase P RNA in solution
和
Determining structures of RNA conformers using AFM and deep neural networks
两篇研究论文。
RNase P是一种存在于所有生命领域的唯一反式作用RNA酶,其功能包括修饰前体转运RNA
(pre-tRNA)
的5′末端,以及处理与癌症相关的长链非编码RNA MALAT1等其他RNA分子。RNase P RNA具有显著的底物多样性和适配能力,但其同时需要一定的结构刚性来维持酶促反应的精准性。这种灵活性与刚性的相互作用如何实现?因此,在这项研究中,研究人员展示了利用单个分子的
原子力显微镜
(
AFM
)
图像和机器学习方法绘制来自嗜热脂肪地芽孢杆菌
(Gst)
的全长RNase P RNA的构象空间。结果通过对宽构象空间的采样为该RNA的底物混杂和催化低效提供了结构动力学基础,同时提供了一种展示RNA构象动力学的新方法。
首先,研究人员通过体外转录技术获得了完整长度的 RNase P RNA,样品在1 mM Mg²⁺下通过AFM得到RNA分子的三维拓扑结构,分辨率达到了 10–15 Å。通过利用深度学习算法HORNET对AFM图像数据进行处理,成功重建了158个独立分子的三维结构。在构象动态分析中,其构象空间涵盖了紧凑型
(C1)
、中间型
(C2)
和展开型
(C3)
三种主要类别。C2型为主体,占比达75%。通过 PCA提取了构象变化的主要动态方向和振幅,进一步分析了 RNA 分子在不同条件下的运动模式。同时,为了探索RNA序列与其动态特性之间的关系,研究团队计算了 RNA 序列的保守性
(sequence conservation score, SCS)
与三维构象稳定性
(3D conformation conservation score , 3DCS)
之间的相关性分析,发现序列保守性高的区域
(如催化核心)
通常对应较低的动态性,而某些高度动态的区域
(如P10.1和P12)
也具有保守的序列特征,表明动态灵活性可能对底物适配性至关重要。
在第二篇论文中,研究人员开发了一种能够解析RNA分子动态异质性的方法
(
HORNET
)
,即利用AFM捕捉RNA单分子在溶液中不同构象的拓扑信息,结合无监督机器学习
(Unsupervised Machine Learning, UML)
与深度神经网络
(Deep Neural Networks, DNN)
,基于伪结构数据库
(psDatabase)
进行训练,并通过六个基准案例验证其精度,提供顶级结构的均方根偏差
(r.m.s.d.)
评估。研究人员进一步
应用HORNET,成功解析了全长RNase P RNA的三种新结构和HIV-1 RRE的五种新构象。
以RNase P RNA为例,研究人员展示了如何通过AFM图像结合动态拟合方法,确定RNA分子三个不同构象状态
(P1、P2和P3)
。通过应用低通傅里叶滤波器,P1、P2和P3图像的分辨率分别为11.5 Å、11.1 Å和12.5 Å。虽然图像分辨率都约为 12 Å,但RNA的结构特点使得AFM成为研究异质性RNA结构和动力学的理想工具。
紧接着,研究人员利用UML方法分析了BM0轨迹模型的r.m.s.d.值,发现大量模型接近真实结构
(PBD ID: 3DHS)
,但其构象与真实结构存在差异。为此,研究中引入了结合三类信息的UML方法:(1) 与初级化学结构、二级和三级结构相关的能量;(2)CCAFM分数;(3)与AFM拓扑约束相关的能量成本
(AFM偏置势)
。结果表明,使用UML方法,经过动态拟合的模型在不同噪声水平下的r.m.s.d.值均保持在约5 Å左右,表明拓扑约束在构象分析中的重要性。
RNA结构预测面临的主要挑战是分子异质性和缺乏结构-序列相关性。利用DNN方法,通过结合RNA结构模型的能量信息、AFM拓扑图
(CCAFM)
和拓扑约束,创建了一个包含超过350万个RPR催化结构域模型的伪结构数据库
(psDatabase)
,成功训练出了高准确度的模型。
最后,研究者通过 HORNET 方法分析 HIV-1 RRE RNA 的构象异质性。在AFM下观察到五种不同RRE构象,验证了其灵活性和异质性。AFM可视化显示,RRE折叠成多种“A”形状,验证了此前基于SAXS数据推导的分子包络。
综上所述,
本研究为RNA结构生物学领域开辟了新方向,尤其是在揭示RNA构象多样性和功能相关性方面具有重要意义。
未来,结合更大规模的RNA结构数据库与更高分辨率的AFM成像技术,HORNET有望进一步提升解析能力,推动RNA分子在基础研究和应用领域的广泛应用。
原文链接:
https://www.nature.com/articles/s41586-024-07559-x
https://www.nature.com/articles/s41586-024-08336-6
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
转载须知
【原创文章】BioArt原创文章,
欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。