王运星
美国卫生健康研究院癌症研究所
在过去的六十年里,自从第一个蛋白质结构肌红蛋白被解析出来以来,人们普遍(无论是明确还是隐含地)认为一条蛋白质初级序列只能折叠成单一(即「一对一」)或极少数的三维结构。这一信念和概念被广泛接受,并在结构生物学的实践中得以应用。 特别是对于高度有结构有序的蛋白质,这一观点基本上是正确的。事实上,在这「一对一」概念的指导下,经过六十年的研究与进展,蛋白质结构生物学的发展已达到颠峰。其标志性成就是人们能够基于蛋白质初级序列利用人工智能辅助算法和结构数据库预测其三维结构,并且能设计出在自然界中不存在的全新蛋白质。这一突破性成就得到了应有的认可, 表现在 2024 年诺贝尔化学奖授予了美国的大卫 · 贝克、德米斯 · 哈萨比斯和约翰 · 琼珀。
现在让我们来谈谈 RNA,另一种十分重要的生物大分子。自从 20 世纪 70 年代第一个 RNA 三维结构 —tRNA
phe
被解析以来,同样的「一对一」概念在很大程度上影响并主导了 RNA 结构生物学的研究。然而,蛋白质结构生物学中的成功并未能在 RNA 结构生物学中得到复制。事实上,情况恰恰相反。在结构数据库中,有超过 20 万个蛋白质条目,但实验解析得到的 RNA 三维结构条目却少于 2000 个。这一点令人震惊,特别是考虑到按照保守估计,人类基因组中编码蛋白质的部分却不到 3%, 而超过 80% 的人类基因组会被转录为 RNA。另外,这些数据库中,独特序列而且长度超过 200 个核苷酸的 RNA 结构条目不到 100 个。
实验解析的 RNA 结构如此稀少的原因至少有两个:过时或错误的概念和技术瓶颈。首先让我们来谈一下有关过时或错误的概念的问题。当研究人员假设 RNA 的初级序列应对应一个或极少数的三维结构时,他们的研究重点便转向和聚焦于寻找完美的溶液条件,使 RNA 分子能够折叠成一个或极少数的三维结构以便于结构解析。正因如此,绝大多数实验解析的 RNA 结构都是在非生理条件下,尤其是高镁离子浓度下获得的(注:镁离子在 RNA 折叠中起决定性作用;细胞内的生理镁离子浓度约为 1 mM,但是,为解析结构,实验的镁离子浓度远高于 1 mM, 甚至高达 500 mM)。然而,即使在极端镁离子浓度下,RNA 初级序列并不一定只能折叠成一个或极少数三维结构或构象。这种做法间接地回避了 RNA 分子在生理条件下具有极高的灵活性构象异质性给结构解析带来的困难。但是这种灵活性和异质性对于其在生理条件下功能和活性却至关重要。单一的 RNA 初级序列可以采用多种甚至无限数量的三维结构或构象。我们此前通过实验已经证明了这一点
(Ding, J. et al.,《自然 · 通讯》, Vol. 14(714),2023)。
因此「一个序列对应一个结构」的原则并不适用于 RNA。
另一个原因是技术瓶颈。常用的技术,如核磁共振(NMR)、X 射线晶体学以及最近的冷冻电子显微镜(cryo-EM),在实验解析 RNA 三维结构方面存在很大挑战。这些技术依赖于对至少数千(如冷冻电镜)、数百万(如 X 射线晶体学)甚至数千万亿(如核磁共振)个结构相同(即结构或构象均一)的分子信号进行叠加。然而,当每个单分子的结构和构象彼此显著不同(构象异质性)时,尤其是在生理条件下,这些技术就会失效。如果想要获 RNA 在生理条件下的真实结构,必须发展新的概念和技术。
我们的研究目标是开发对这一领域有重要意义的新技术,新方法和新概念,来克服这一领域里的技术性障碍和瓶颈,并纠正 RNA 结构生物学中的概念性误区。因此,这两篇文章是有关于生物学中最为基本但非常重要的问题。第一篇手稿报告了一种利用原子力显微镜(AFM)图像和神经网络解析过去结构生物学中无法解决的单分子 RNA 三维结构和构象的新方法和技术。同期第二篇手稿描述了首次使用第一篇手稿中提出的方法和技术,在接近生理条件下绘制 RNA 的完整结构和构象空间和 RNA 在溶液中全新行为。这项
研究工作所带来了若干重要发现可能会更新人们对 RNA 序列、三维结构和功能关系的认识。
(
https://www.nature.com/articles/s41586-024-07559-x
)
一种解析单分子异质 RNA 在溶液中构象三维结构的新方法和技术
人类基因组的大部分被转录为 RNA,其中许多 RNA 含有对功能至关重要的结构片段。即使在结构紧凑、折叠良好的情况下,这些 RNA 分子仍表现出构象异质性和灵活性。这些特性对其功能必不可少,但也限制了核磁共振、晶体学和冷冻电子显微镜等方法在结构解析中的应用。此外,由于缺乏大型 RNA 结构数据库且序列与结构之间没有明确的相关性,类似 AlphaFold 的结构预测方法无法适用于 RNA。
因此,解析异质 RNA 结构是结构生物学领域尚未解决的一项重大挑战。在此,我们提出了一种新方法,名为 HORNET。该方法结合了深度神经网络和溶液 RNA 单分子原子力显微镜(AFM)成像,来解析 RNA 的三维拓扑结构。得益于 AFM 的高信噪比,这一方法能用来解析单个分子的拓扑结构,而无需对无数个分子的信号进行叠加来解析三维结构。因此,此方法特别适合捕捉大型 RNA 分子在溶液中的不同构象结构。我们用了六个基准案例验证了 HORNET 的实用性,并解析了两个实例,即 RNase P RNA 和 HIV-1 RR
E RNA,来展示分子在溶液中的构象异质性。我们的方法解决了解析在溶液中 RNA 异质结构的挑战,可能会对 RNA 结构生物学的基础研究产生深远影响。
(
https://www.nature.com/articles/s41586-024-08336-6
)
自 1958 年第一个蛋白质三维结构肌红蛋白被解析以来,人们习惯于将蛋白质视为静态三维结构。这些静态结构揭示了分子中原子的三维排列,给人们认知和理解蛋白质的功能和活性提供了重要的依据,但并未直接提供原子如何运动及位置如何变化的信息。
这些信息对于理解生物大分子在生理条件下的功能和活性至关重要,但却很难获取。通过溶液原子力显微镜、深度神经网络、统计分析以及以 RNase P RNA 为例,我的研究团队展示了 RNase P RNA 的在生理条件下的溶液中的构象异质性。其包括高度灵活的外围结构 片段以及一个构象不变的核心,这些结构片段以准零能量代价在多个方向上以 20–60 Å 的幅度广阔的构象空间不断地蠕动。增加 Mg²⁺ 浓度会促进构象收缩并增强酶活性,这可能是通过缩小构象空间实现的。此外,对空间灵活性与序列守恒的相关性和负相关性的分析表明,RNA 的初级顺序决定关键区域的结构和动态功能。
这些发现揭示了 RNase P RNA 在保持酶促精确性与底物多样性方面的结构-动态基础。这里需要提到的是 RNase P 酶是细胞里最为基本但十分重要的酶之一,而 RNA 是这一酶里的催化机理的核心。
我们使用 RNase P RNA 所展示的结果对其他大型 RNA(如长非编码 lcRNA)也具有普遍意义。此外,RNase P RNA 所体现的构象和结构异质性将激发关于 RNA 结构预测的深入讨论。最后,这项研究标志着结构生物学从解析静态结构研究朝向获取分子「电影」研究方向的转变可能性,迎来结构生物学新时代的焦点之一。
审核:王运星
图片版权:Nature、图虫创意
如需代发文章宣传、新闻稿、招聘等,请后台回复【学术】添加小编
我们长期为科研用户提供前沿资讯、实验方法、选品推荐等服务,并且组建了 70 多个不同领域的专业交流群,覆盖
神经科学、肿瘤免疫、基因编辑、外泌体、类器官
等领域,定期分享实验干货、文献解读等活动。