2025年2月26日,西湖大学医学院
郭天南
、哈佛医学院
Judith A. Steen
、马克斯·普朗克生物化学研究所
Matthias Mann
受邀在
Nature
发表题为
Mass-spectrometry-based proteomics: from single cells to clinical applications
的蛋白质组学综述。
这是自2016年由蛋白质组学两位领军人物Ruedi Aebersold 和 Matthias Mann发表领域内的综述之后,近十年来的又一篇总结。
文章系统地回顾了近十年来基于质谱的蛋白质组学技术的发展历程和最新进展,详细介绍了该技术领域内的全流程革新
。作者强调,通过从硬件到软件的技术革新和推广,基于质谱的蛋白质组学已实现从常规生物样本到单细胞乃至空间分辨分析的大规模检测,显著提升了蛋白质鉴定、定量及结构解析的深度和准确性。
文章同时探讨了蛋白质组学向临床应用转化的巨大潜力与面临的挑战,包括疾病生物标志物的发现以及多标志物检测方法的发展,并进一步指出并强调了靶向蛋白质组学技术在疾病诊断和精准治疗中的应用前景。
在文末,作者展望了未来蛋白质组学的发展方向,认为在自动化、多组学数据整合,尤其是人工智能的推动下,该领域必将进一步突破现有瓶颈,为揭示复杂生物系统和疾病机制提供全新的视角和途径,最终推动精准医疗的实现。
近年来,随着自动化和标准化技术的引入,生物样品前处理流程的效率和重复性大幅提高。包括福尔马林固定石蜡包埋
(FFPE)
组织和考古样本在内的多种样本类型均可被成功分析。在色谱分离方面,得益于现代质谱仪的高灵敏度,传统上的纳升级流速逐渐被微升级流速取代,大大提升了色谱方法的稳健性。与此同时,质谱仪器本身也在不断进步。虽然Orbitrap分析仪依然占据主导地位,但飞行时间
(TOF)
分析仪得到了复兴,例如timsTOF采用并行累积—串行碎片
(PASEF)
技术,通过离子迁移分离提高了肽段的测序效率,而Astral分析仪则通过多反射TOF结合Orbitrap进行MS1分析,实现了近乎无损的离子检测和卓越的分辨率。
此外,数据采集策略也经历了显著变革。传统的数据依赖性采集
(DDA)
模式受限于信号检测的偏向性和随机性,越来越多的研究使用数据非依赖性采集
(DIA)
模式。DIA通过对全质量范围内的多肽离子按连续窗口模式进行扫描和碎片化,可以无偏向性地检测基本上所有的多肽离子,极大地降低了不同样本间的缺失值。结合先进的机器学习和深度学习算法,可以大幅提升DIA复杂MS谱图的解读效率。针对临床应用的定量需求,靶向蛋白质组学
(S/MRM)
技术正迅速发展,通过短色谱梯度实现高通量、绝对定量的目标肽段测定。
文章
特别强调了人工智能在基于质谱的蛋白质组学研究中的变革性作用
。深度学习算法不仅能够预测肽段在整个流程中的表现
(例如肽段的保留时间和特异性)
,提高鉴定与定量的准确性,还在生物标志物的挖掘和生物学意义的解读中展现出巨大潜力。在谱图解析过程中整合大型语言模型
(如ChatGPT、DeepSeek等)
的应用,未来将有望加速数据解释和假设生成,将蛋白质谱技术推向新的高度。
总体来说,这些技术革新使得基于质谱的蛋白质组学成为一个高通量、高灵敏度且极具适用性的分析平台,实现从单细胞研究到大规模临床试验等领域的广泛应用。
文章从七个不同的角度展示了基于质谱的蛋白质组学在解析生物系统中的多维应用。通过
表达蛋白质组学
(Expression proteomics)
,我们可以了解蛋白质在不同条件下的定量变化;
相互作用蛋白质组学
(Interaction proteomics)
揭示了细胞内复杂的分子互联网络;
翻译后修饰(PTMs)和结构蛋白质组学
(Structural proteomics)
则分别从功能调控和结构解析两个层面,为蛋白质的动态变化提供了详细描述;
化学蛋白质组学
(Chemoproteomics)
和
单细胞蛋白质组学
(Single-cell proteomics)
则进一步拓展了应用边界,前者为药物靶点发现和机制研究提供了新工具,后者则突破了细胞异质性研究的技术瓶颈;而
空间蛋白质组学
(Spatial proteomics)
则通过保持组织原有的空间信息,使得我们能够从组织和亚细胞水平上更直观地理解生物学功能及病理过程。
(1)Expression proteomics(表达蛋白质组学)
表达蛋白质组学主要关注在不同生理或病理条件下蛋白质丰度的变化。通过大规模定量分析,研究人员可以揭示细胞如何响应生活方式、基因变异、环境毒素及感染等多种风险因素,从而为药物研发和伴随诊断提供依据。当前的技术已经能够在常见细胞系中同时定量上万种蛋白,而通过预分馏技术,甚至可以达到近全面的覆盖。这不仅证明了蛋白质组与转录组在调控机制上的差异,也强调了蛋白质直接反映细胞功能的重要性。
(2)Interaction proteomics(相互作用蛋白质组学)
这一领域聚焦于解析蛋白质与其他分子
(如蛋白、RNA、DNA、小分子药物)
之间的交互作用。传统的亲和纯化方法与新兴的邻近标记技术相结合,使得研究者能够构建起近乎完整的蛋白质互作网络,为理解细胞内复杂信号传导和调控机制提供了强有力的数据支持。
同时,利用基因编辑工具和AI辅助
(如AlphaFold-Multimer等)
工具,进一步解析多蛋白复合体的结构和功能,为病理状态下的分子机制研究提供了新的视角。
翻译后修饰在调控蛋白质功能、定位和相互作用中起着至关重要的作用。通过自动化富集、离子淌度分离等技术,研究人员现已能精确检测和定量数万个PTM位点,如磷酸化、泛素化和乙酰化等。这样的高分辨率分析不仅揭示了信号通路在细胞周期、信号转导及衰老等过程中的动态变化,也利用机器学习等AI技术帮助筛选出功能性修饰,从而加深了我们对细胞调控网络复杂性的认识。
(4)Structural proteomics(结构蛋白质组学)
结构蛋白质组学通过MS技术研究蛋白质的三维结构和动态变化,提供了传统结构生物学难以获得的信息。方法上包括氢—氘交换
(HDX-MS)
、交联质谱
(XL-MS)
以及有限蛋白水解等,它们能够在大规模水平上揭示蛋白质构象变化、蛋白复合物内部相互作用以及结合位点信息。这些技术为解析蛋白质功能提供了结构层面的支持,同时也为药物设计和抗体开发等应用奠定了基础。
(5)Chemoproteomics(化学蛋白质组学)
化学蛋白质组学着重于系统性地探测蛋白质与小分子之间的相互作用,成为药物发现和靶点鉴定的重要工具。文章中提到,基于活性的蛋白质谱
(ABPP)
利用化学探针直接捕获特定蛋白家族的酶活性,而热蛋白质谱
(TPP)
则通过温度诱导蛋白变性来识别小分子药物的直接靶点。近年来,通过对降解剂的筛选,研究人员甚至能够针对“不可药物化”的靶点设计出能够特异性促进蛋白降解的新策略,极大地扩展了治疗干预的范围。
(6)Single-cell proteomics(单细胞蛋白质组学)
单细胞蛋白质组学旨在解决传统蛋白质组学无法捕捉细胞间异质性的问题。由于单个细胞中蛋白质的绝对量极低
(仅为五十到五百皮克)
,该领域面临着极高的灵敏度要求。为此,研究者开发了包括纳升级液滴处理技术、利用稳定同位素标签
(isobaric labelling)
实现单细胞与载体通道结合的SCoPE方法以及微流控技术在内的一系列创新手段,并结合DIA数据采集策略,有效提升了单细胞蛋白定量的准确性。借助这些技术,目前已经能够在单个肿瘤细胞中鉴定到最高5000多种蛋白,为揭示细胞状态和功能提供了更直接、精确的数据支持。
(7)Spatial proteomics(空间蛋白质组学)
尽管单细胞分析揭示了细胞内在的异质性,但往往缺乏组织层面的空间信息。空间蛋白质组学通过保留样本中蛋白质的空间分布,结合高分辨率成像、AI驱动的细胞分类与微切割技术,成功构建了组织中各细胞类型或状态的蛋白表达图谱。这种方法不仅能揭示细胞间的物理相互作用,还能为理解组织结构和病理状态
(例如在药物诱导皮肤病变中的应用)
提供新的分子依据,推动精准医疗的发展。近期,这个领域出现了深度视觉蛋白质组学
(DVP)
和组织膨胀蛋白质组学
(expansion proteomics)
等技术。
总体来说,这七个方向相辅相成,共同推动了蛋白质组学技术的不断进步,为基础生物学研究和临床应用提供了丰富而精准的数据支撑。
文章还探讨了如何将成熟的蛋白质谱技术从实验室研究转化为临床应用,以改善疾病的诊断、预后评估和治疗决策。
血液样本一直被视为潜在生物标志物的宝库。然而,血浆中蛋白质的丰度跨度极大
(超过十个数量级)
,给定量分析带来了巨大挑战。随着液体样本自动化系统、先进的HPLC
(高效液相色谱)
系统以及高灵敏度质谱仪
(如timsTOF和Astral)
的不断进步,现有的质谱工作流程已经能够对未经处理的血浆样本进行有效分析,并通过部分优化流程实现每天上百个样本的快速检测,以便于大规模临床队列的研究。
例如,一种采用液体处理器、Evosep HPLC系统和timsTOF质谱仪的工作流程,已成功快速分析了1,612个样本,并在败血症生物标志物的发现中发挥了关键作用;而借助Astral质谱仪,该流程在单次进样中检测的蛋白种类可提升至约1,000种,每天可处理上百个样本,可为临床队列分析提供坚实的数据支持。
与此同时,通过新型非特异性富集策略
(例如利用纳米颗粒实现的富集方案)
,研究者正致力于进一步提高血浆蛋白的检测深度,争取实现对数千种蛋白的定量分析,从而更全面地挖掘潜在的生物标志物。
文章还讨论了其他体液
(如尿液、泪液等)
在临床应用中的潜力,体液样本因其相对较低的侵入性采集方式和与特定疾病的高相关性,逐渐受到关注。
与此同时,组织样本的蛋白质谱分析也在不断进步,像CPTAC等项目通过对大量肿瘤样本进行多层次分析,不仅揭示了肿瘤亚型和驱动突变,还为未来个性化治疗提供了分子依据。
尽管质谱检测在生物标志物的发现上显示出巨大潜力,但从疾病标志物发现到临床测试的转化仍面临诸多挑战,如技术的标准化流程、基于质谱的检测方法的成本、以及严格的临床验证
(包含政策和技术两方面)
要求等。为此,文章强调,未来需要更多的靶向蛋白质组学策略,结合内标定量和标准化流程,以确保检测结果的准确性和可重复性,从而满足临床和监管部门的要求。
最后,文章展望了基于质谱的蛋白质组学未来的发展前景,并重点讨论了AI在这一领域中的核心作用。
随着样品制备、色谱分离、质谱仪器和数据采集策略的不断进步,蛋白质组学将实现更深层次的蛋白质覆盖,从微量样本中提取出更丰富的信息,同时自动化和标准化的工作流程将使这一技术更加普及,惠及更广泛的科研群体。尽管最新一代质谱仪的高通量特性部分抵消了其高昂的成本,但如何降低设备和运行成本仍是进一步推广的重要瓶颈。
与此同时,AI正在从多个层面推动蛋白质组学的革新。深度学习算法不仅能够优化数据采集和实时决策,还在肽段和蛋白质的识别、定量及结构解析中展现出巨大潜力,有助于从庞大的数据集中提取出关键的生物学信息。
AI赋能的蛋白质谱。AI在其中的应用涵盖了从实验设计、样品制备到数据解读、预测和整合不同组学数据等多个方面,旨在提升蛋白质组学研究的效率和深度。
文章进一步预测,随着更多蛋白质组数据
(特别是微扰蛋白质组数据)
的积累,研究人员有望构建出具备深层生物学理解能力的“基础模型”,这些模型甚至可能实现从谱图到氨基酸序列的自动翻译,从而赋予蛋白质组学更强的解析和预测能力。
除此之外,多组学数据的整合
(包括基因组、转录组和代谢组)
将在揭示细胞内分子网络和复杂疾病机制中发挥关键作用,而开放源码软件、共享数据仓库及标准化实验和数据分析流程的建立,也将促进全球范围内的合作与知识传播。
文章描绘了一个充满前景的未来图景:在技术创新、计算方法和跨学科合作的推动下,蛋白质组学将不断突破现有局限,为基础生物学研究和精准医疗带来革命性的变革。
https://www.nature.com/articles/s41586-025-08584-0
西湖大学郭天南课题组 (guomics.com) 长期从事蛋白质组学相关研究,联合人工智能,解析生物过程的原理,助力疾病诊疗。团队诚邀AI方向优秀研究生及博士后研究人员加盟!
制版人:十一
BioART战略合作伙伴
(*排名不分先后)