RNA分子作为生命体内重要的生物大分子,其结构多样性和动态性直接决定了其功能。近年来,RNA因其在基因调控、新型生物技术开发以及药物设计中的潜在应用引起了广泛关注。然而,由于RNA分子通常具有异质性和高度动态性,现有的主流结构解析技术如核磁共振(NMR)、X射线晶体学及冷冻电子显微镜(Cryo-EM)难以全面揭示RNA的动态构象。同时,现有的研究中缺乏大型RNA结构数据库,RNA序列和结构间的直接关联尚不明确。用于预测蛋白质结构的方法如AlphaFold也无法应用于RNA的三维结构预测。近日,美国国家癌症研究所的Yun-Xing Wang教授在Nature发表了题为The conformational space of RNase P RNA in solution和Determining structures of RNA conformers using AFM and deep neural networks两篇研究论文。RNase P是一种存在于所有生命领域的唯一反式作用RNA酶,其功能包括修饰前体转运RNA(pre-tRNA)的5′末端,以及处理与癌症相关的长链非编码RNA MALAT1等其他RNA分子。RNase P RNA具有显著的底物多样性和适配能力,但其同时需要一定的结构刚性来维持酶促反应的精准性。这种灵活性与刚性的相互作用如何实现?因此,在这项研究中,研究人员展示了利用单个分子的原子力显微镜(AFM)图像和机器学习方法绘制来自嗜热脂肪地芽孢杆菌(Gst)的全长RNase P RNA的构象空间。结果通过对宽构象空间的采样为该RNA的底物混杂和催化低效提供了结构动力学基础,同时提供了一种展示RNA构象动力学的新方法。首先,研究人员通过体外转录技术获得了完整长度的 RNase P RNA,样品在1 mM Mg²⁺下通过AFM得到RNA分子的三维拓扑结构,分辨率达到了 10–15 Å。通过利用深度学习算法HORNET对AFM图像数据进行处理,成功重建了158个独立分子的三维结构。在构象动态分析中,其构象空间涵盖了紧凑型(C1)、中间型(C2)和展开型(C3)三种主要类别。C2型为主体,占比达75%。通过 PCA提取了构象变化的主要动态方向和振幅,进一步分析了 RNA 分子在不同条件下的运动模式。同时,为了探索RNA序列与其动态特性之间的关系,研究团队计算了 RNA 序列的保守性(sequence conservation score, SCS)与三维构象稳定性(3D conformation conservation score , 3DCS)之间的相关性分析,发现序列保守性高的区域(如催化核心)通常对应较低的动态性,而某些高度动态的区域(如P10.1和P12)也具有保守的序列特征,表明动态灵活性可能对底物适配性至关重要。在第二篇论文中,研究人员开发了一种能够解析RNA分子动态异质性的方法(HORNET),即利用AFM捕捉RNA单分子在溶液中不同构象的拓扑信息,结合无监督机器学习(Unsupervised Machine Learning, UML)与深度神经网络(Deep Neural Networks, DNN),基于伪结构数据库(psDatabase)进行训练,并通过六个基准案例验证其精度,提供顶级结构的均方根偏差(r.m.s.d.)评估。研究人员进一步应用HORNET,成功解析了全长RNase P RNA的三种新结构和HIV-1 RRE的五种新构象。以RNase P RNA为例,研究人员展示了如何通过AFM图像结合动态拟合方法,确定RNA分子三个不同构象状态(P1、P2和P3)。通过应用低通傅里叶滤波器,P1、P2和P3图像的分辨率分别为11.5 Å、11.1 Å和12.5 Å。虽然图像分辨率都约为 12 Å,但RNA的结构特点使得AFM成为研究异质性RNA结构和动力学的理想工具。紧接着,研究人员利用UML方法分析了BM0轨迹模型的r.m.s.d.值,发现大量模型接近真实结构(PBD ID: 3DHS),但其构象与真实结构存在差异。为此,研究中引入了结合三类信息的UML方法:(1) 与初级化学结构、二级和三级结构相关的能量;(2)CCAFM分数;(3)与AFM拓扑约束相关的能量成本(AFM偏置势)。结果表明,使用UML方法,经过动态拟合的模型在不同噪声水平下的r.m.s.d.值均保持在约5 Å左右,表明拓扑约束在构象分析中的重要性。RNA结构预测面临的主要挑战是分子异质性和缺乏结构-序列相关性。利用DNN方法,通过结合RNA结构模型的能量信息、AFM拓扑图(CCAFM)和拓扑约束,创建了一个包含超过350万个RPR催化结构域模型的伪结构数据库(psDatabase),成功训练出了高准确度的模型。最后,研究者通过 HORNET 方法分析 HIV-1 RRE RNA 的构象异质性。在AFM下观察到五种不同RRE构象,验证了其灵活性和异质性。AFM可视化显示,RRE折叠成多种“A”形状,验证了此前基于SAXS数据推导的分子包络。综上所述,本研究为RNA结构生物学领域开辟了新方向,尤其是在揭示RNA构象多样性和功能相关性方面具有重要意义。未来,结合更大规模的RNA结构数据库与更高分辨率的AFM成像技术,HORNET有望进一步提升解析能力,推动RNA分子在基础研究和应用领域的广泛应用。原文链接:
https://www.nature.com/articles/s41586-024-07559-x
https://www.nature.com/articles/s41586-024-08336-6
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。