专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
BioArt  ·  Cell |何川/Tao ... ·  昨天  
生信菜鸟团  ·  读书笔记 | 癌症计算系统生物学 | 第 ... ·  4 天前  
生物学霸  ·  王立铭实验室招聘科研助理/博士后 ·  4 天前  
51好读  ›  专栏  ›  生信菜鸟团

Cell | 蛋白质-蛋白质相互作用在健康和疾病中的发现及其意义

生信菜鸟团  · 公众号  · 生物  · 2024-11-21 06:40

正文

Basic Information

  • 英文标题: Discovery and significance of protein-protein interactions in health and disease
  • 中文标题:蛋白质-蛋白质相互作用在健康和疾病中的发现及其意义
  • 发表日期:14 November 2024
  • 文章类型:Review
  • 所属期刊:Cell
  • 文章作者:Jack F. Greenblatt | Nevan J. Krogan
  • 文章链接:https://www.sciencedirect.com/science/article/pii/S0092867424012534

Summary

Para_01
  1. 单个蛋白质-蛋白质相互作用(PPIs)的鉴定始于40多年前,使用了蛋白质亲和层析和抗体共免疫沉淀。
  2. 随着新技术的出现,通过引入细胞内标记方法、亲和纯化(AP)结合质谱(MS)以及共分级质谱(CF-MS),PPIs的分析扩展到了全基因组规模。
  3. 现在,将这些相互作用目录与互补方法相结合,包括交联质谱(XL-MS)和低温电子显微镜(cryo-EM),有助于在同一或不同蛋白质复合物内部区分直接相互作用和间接相互作用。
  4. 这些强大的方法以及像AlphaFold这样的人工智能应用的前景预示着一个未来,在这个未来,PPIs和蛋白质复合物,包括能量驱动的蛋白质机器,将在细节上被深刻理解,从而在基础生物学和疾病背景下解锁新的见解。

Introduction

Para_01
  1. 使生命成为可能的复杂化学反应是由构成细胞干重近90%的生物大分子决定的。
  2. 这些大分子中最主要的是蛋白质,这种极其多才多艺的聚合物不仅催化细胞所需的大多数化学反应,还发挥关键的结构作用。
  3. 这两种功能通常需要蛋白质相互组装形成蛋白质复合体。
  4. 许多这样的复合体作为‘蛋白质机器’工作,在其中有序的变构形状变化产生一系列对细胞有用的构象变化。
  5. 一些蛋白质机器已经得到了非常详细的了解,它们可以从纯化的组分中重组,并在体外进行了广泛的调查,最终导致了高分辨率的结构表征。
  6. 两个著名的例子是执行DNA转录和DNA复制的大蛋白复合体。
  7. 在这两种情况下,发现和剖析蛋白质机器需要创建特定生化过程的高度敏感和特异性检测方法。
  8. 结合遗传分析,这使得能够识别、纯化并在试管中功能性地表征催化该过程的所有组分。
  9. 类似的生化功能检测使研究人员能够开发出对包括蛋白酶体、染色质重塑复合体、剪接体和核糖体在内的众多其他蛋白质机器的分子和结构理解(最后两个是RNA起核心作用的机器)。
Para_02
  1. 令人清醒的是,已知最简单的活细胞——一种工程改造的支原体——只含有473个对它繁殖重要的基因,而其中近三分之一的功能尚不清楚。
  2. 对于人类基因组而言,即使不考虑许多基因具有多种功能的问题,我们只能猜测大约20,000个蛋白质编码基因中的许多数千个基因的功能。
  3. 为了维持生命的存在,还有多少活动是我们完全不了解的?
  4. 很可能在我们的细胞中存在数百种尚未表征的蛋白质机器,我们没有生物化学检测方法来发现它们,需要不同的方法来找到它们。
  5. 理解这些蛋白质机器对于我们理解基本生物学过程和疾病状态背后的生物学至关重要——这对于开发急需的治疗方法的知识是至关重要的。
  6. 蛋白质-蛋白质相互作用(PPI)图谱代表了解决这些问题的一种有希望的方法。

Insights into biological function from the identification of PPIs using protein affinity chromatography

Para_01
  1. 对细胞蛋白质相互作用(PPIs)的理解进步与技术创新同步进行(图1)。
  2. 由于蛋白质与其他分子的相互作用通常具有极高的特异性,早期尝试识别PPIs的一些方法利用了蛋白质亲和层析技术。
  3. 自20世纪初以来,亲和层析作为一种方法被用于纯化与特定分子结合的蛋白质,或表征酶和其他蛋白质与其底物、辅因子及其他相互作用者的相互作用。
  4. 它可能最早在1910年由斯塔肯斯坦使用不溶性淀粉作为配体和支持物来纯化α-淀粉酶。
  5. 在随后的几十年里,亲和层析所用的支持物以及将配体连接到支持物的方法得到了许多改进,通常目的是使用固定的抗原来从血清中纯化特异性抗体。
  6. 最初,抗原被连接到高岭土或木炭等支持物上,但一个重要的改进是使用重氮化的p-氨基苄基纤维素共价连接牛血清白蛋白,然后是各种半抗原,用于分离特异性抗体。
  7. 后来,引入了珠状琼脂糖(Sepharose),而不是纤维素,改善了支持物的机械性能,而引入的氰基溴化物(CNBr)活化的琼脂糖珠使得通过一级氨基将蛋白质和其他分子连接到琼脂糖上变得容易。
  8. 然后,与CNBr活化的琼脂糖偶联的酶底物和蛋白质抗原被常规用于纯化酶和抗体。
  • 图1. 评估蛋白质-蛋白质相互作用的重要研究、实验和计算方法的时间线
Para_01
  1. 尽管原则上,以这种方式固定的纯化蛋白质可以用来在细胞提取物中无偏见地搜索其未知的相互作用伙伴,但直到20世纪80年代初,才使用蛋白质亲和层析法来寻找与噬菌体λ和噬菌体T4蛋白质相互作用的蛋白质。
  2. 对于噬菌体λ,蛋白质亲和层析是使用λ N蛋白作为配体进行的,这是一种转录抗终止因子。
  3. 由于大肠杆菌菌株中nusA(N利用物质A)和nusB基因突变导致λ生长受损,原因是抗终止作用丧失,且N蛋白在体外的抗终止活性需要加入来自λ宿主大肠杆菌的粗提物,因此很可能需要宿主蛋白质,其中至少有一种可能直接与λ N蛋白相互作用。
Para_02
  1. N 蛋白亲和柱仅保留了一种大肠杆菌蛋白,该蛋白不与琼脂糖珠基质结合。这种蛋白被鉴定为 NusA,因为 nusA1 温度敏感突变导致鉴定出的蛋白变得温度敏感并改变了其电荷。
  2. 当 NusA 被纯化并随后固定用于未感染的大肠杆菌提取物的亲和层析时,它仅结合 RNA 聚合酶,表明 λ N 蛋白正在使用 NusA 作为适配器与 RNA 聚合酶相互作用。
  3. 当其他宿主辅因子 NusB、核糖体蛋白 S10 (RPS10) 和 NusG 用作亲和层析的配体时,它们各自结合了这一终止/抗终止调控系统中的另一个组分。
  4. 与这些观察结果一致的是,一个稳定的核糖核蛋白复合体在 nut 位点 RNA 上形成,包含 N 及其宿主辅因子和 RNA 聚合酶。
  5. 类似的蛋白质亲和层析实验用于识别参与噬菌体 T4 DNA 复制和重组的蛋白质之间的 PPIs。
  6. 例如,当 T4 基因 32 单链 DNA 结合蛋白固定在珠子上时,至少有 10 种 T4 蛋白和三种大肠杆菌宿主蛋白特异性结合。这 10 种 T4 蛋白中有 9 种可以被鉴定为参与 T4 复制和重组。1983 年,编码这些宿主蛋白的大肠杆菌基因无法被鉴定——而今天则很容易做到这一点。
Para_03
  1. 在这些蛋白质亲和层析实验中观察到的精美的 PPI 特异性可能是在进化过程中被选择出来的,而生物学上无关的相互作用则被反选择。
  2. 蛋白质亲和层析的一个重要优势是,可以增加固定化配体的浓度,从而检测出结合常数小于 10^5 M-1 的较弱的 PPIs。
  3. 较弱的相互作用也可以通过其他方法检测,例如使用高浓度的融合蛋白从细胞提取物中进行沉淀,或在细胞中过表达标记蛋白,或在亲和纯化前在细胞中交联蛋白质,这些方法将在下面描述。

Limitations of protein affinity chromatography

蛋白质亲和层析的局限性

Para_04
  1. 早期,蛋白质亲和层析需要克服两个主要的技术障碍。
  2. 第一个问题是作为配体使用的高纯度蛋白质的需求。
  3. 在20世纪80年代,相对较少的蛋白质被纯化,因为使用常规柱层析的纯化方案通常耗时且困难,特定蛋白质的纯化方案可能需要数年时间来开发。
  4. 此外,尽管在20世纪70年代中期引入了重组DNA技术,但克隆的基因仍然很少,用于蛋白质过表达的载体尚未普遍使用,利用AP标签来促进蛋白质纯化的技术也尚未引入。
  5. 因此,不出所料,早期使用粗细胞提取物进行蛋白质亲和层析的两个例子使用了高度丰富的细胞骨架蛋白肌动蛋白和微管蛋白作为配体。
Para_05
  1. 第二个主要障碍是确定相互作用的蛋白质。
  2. 如果所研究的生物系统中的蛋白质成分已经纯化,并且它们在SDS聚丙烯酰胺凝胶上的迁移率已知,那么这可能就很容易了,就像T4复制蛋白和最终λN蛋白参与的转录抗终止蛋白的情况一样。
  3. 另一方面,只有因为NusA是当时通过遗传鉴定出的λN蛋白转录抗终止作用的宿主因子之一,才能识别NusA作为与λN蛋白相互作用的宿主辅助因子。
  4. 在没有全面遗传调查的情况下,这种情况在大肠杆菌和果蝇中也极为罕见,而在其他生物体中几乎从未发生过,确定一个相互作用蛋白的功能将不得不依赖于猜测其功能并进行适当的生化分析。
  5. 这种相当直观的方法导致了TFIIF(一种与RNA聚合酶II相互作用的一般启动因子)亚基的纯化和鉴定,以及大量果蝇肌动蛋白丝和微管结合蛋白的鉴定。
  6. 在1980年代,通过蛋白质亲和层析后识别相互作用的蛋白质可能既需要辛勤工作,也需要运气或独创性。

Additional biological insights from using antibodies and fusion proteins to identify PPIs

Para_01
  1. 蛋白质亲和层析的一种替代方法是产生针对纯化蛋白的抗体,然后使用这些抗体从细胞提取物中免疫沉淀该蛋白及其相互作用伙伴。
  2. 在早期的一个重要实验中,一种未知功能的宿主蛋白,在SDS聚丙烯酰胺凝胶上的表观分子量为53 kDa,与SV40大T抗原共免疫沉淀,而肿瘤抑制蛋白RB与其它病毒癌蛋白共免疫沉淀。
  3. 十年后,在癌症生物学中的一个重要例子表明,针对病毒癌蛋白pp60v-src及其活化的细胞对应物pp60c-src的单克隆抗体可以从细胞提取物中与含有磷酸酪氨酸的蛋白质共免疫沉淀,并且这依赖于src蛋白的SH2域。
  4. 这一见解很快导致了观察到SH2域与含磷酸酪氨酸的肽之间的直接相互作用在细胞信号网络中起关键作用。
  5. 另一个重要的成功案例是使用针对果蝇TATA盒结合蛋白(TBP)的单克隆抗体共免疫沉淀RNA聚合酶II通用启动因子TFIID的其他亚基,即TBP相关因子(TAFs),从而确定、克隆和功能表征这些转录共激活因子在各种物种中的作用。
Para_02
  1. 随着 1980 年代克隆出越来越多的蛋白质,一个重要的进展是设计融合蛋白,即将各种伙伴连接到感兴趣的蛋白质上。
  2. 这些融合伙伴或"标签",是可以通过亲和层析一步纯化的肽或蛋白质。
  3. 1988 年首次描述了两种这样的融合伙伴,即谷胱甘肽-S-转移酶 (GST) 和麦芽糖结合蛋白 (MBP)。
  4. GST 和 MBP 融合蛋白可以通过分别结合到谷胱甘肽或麦芽糖柱上,然后用谷胱甘肽或麦芽糖洗脱出天然形式进行纯化。
  5. 多年来,引入了许多其他蛋白质标签,包括与固定化免疫球蛋白 G (IgG) 结合的金黄色葡萄球菌蛋白 A、与镍或钴柱结合的多组氨酸序列以及已有良好抗体用于免疫纯化的短肽标签(例如,流感病毒血凝素 [HA] 蛋白)。
  6. 在数千次此类实验中,将与琼脂糖珠结合的融合蛋白与细胞提取物混合,以"拉下"相互作用的蛋白质。
  7. 在 1990 年的重要癌症生物学实验中,重组 SH2 结构域与大肠杆菌 TrpE 蛋白融合,通过与固定化 TrpE 抗体结合的珠子,用于拉下被酪氨酸磷酸化的表皮生长因子 (EGF) 和血小板衍生生长因子 (PDGF) 受体。

Limitations of using co-immunoprecipitation or pull-downs to identify PPIs

使用共免疫沉淀或下拉实验来鉴定蛋白质-蛋白质相互作用的局限性

Para_03
  1. 尽管产生了指导基础和疾病生物学的基本结果,但共免疫沉淀在多蛋白研究中的可扩展性甚至不如蛋白质亲和层析,因为它不仅需要将所研究的蛋白质纯化至均一,还需要制备高度特异性的抗体,这可能非常困难。
  2. 此外,这种抗体可能会干扰目标蛋白组装成蛋白质复合物的过程。
  3. 另外,无论用于拉下的标签是什么,如果融合伴侣阻止了目标蛋白与一个或多个伙伴的相互作用,或者阻止了其组装成蛋白质复合物,这种方法都可能失败。
  4. 在基因组测序出现之前的许多年里,克隆编码感兴趣蛋白质的基因或cDNA是一个缓慢且费力的过程。
  5. 它需要纯化蛋白质,然后使用抗体筛选表达文库,或者根据肽序列设计寡核苷酸来筛选DNA文库。
  6. 此外,过表达的融合蛋白在大肠杆菌中可能是可溶的,但通常不是,即使它是原核蛋白也是如此,特别是当它是缺乏必要的翻译后修饰(PTMs)、分子伴侣或两者兼有的真核蛋白时。
  7. 为了克服这些问题,最终开发出了在昆虫、酵母和哺乳动物细胞中过表达蛋白质的系统,以及其他系统。
  8. 无论使用蛋白质亲和层析、共免疫沉淀还是标签,直到基因组序列的出现和通过质谱(MS)鉴定蛋白质,识别相互作用的蛋白质以实现其功能和生物学意义的表征仍然困难。

Insights from using intracellular tagging, AP, and MS to identify PPIs: AP-MS

Introduction of MS to identify interacting proteins

介绍 MS 用于识别相互作用的蛋白质

Para_01
  1. 在1990年代末确定基因组序列之前,如果通过Edman降解法测定了其N端氨基酸序列,并且幸运地,其cDNA已经克隆和测序,那么偶尔可以识别出一个相互作用的蛋白质。
  2. 这一情况在1988年发生了改变,当时两种软离子解吸方法——电喷雾电离(ESI)和基质辅助激光解吸电离(MALDI)的发展,首次使得通过质谱(MS)测定大生物分子(包括肽和蛋白质)的质量电荷比(m/z值)成为可能。
  3. 这导致了1993年的一个认识,即使用特定氨基酸蛋白酶如胰蛋白酶消化蛋白质后获得的肽的质量可以通过质谱测定,然后用于搜索DNA或氨基酸序列数据库以鉴定该蛋白质。
  4. 不到十年后的许多基因组测序开启了当前的"蛋白质组学"时代,在这个时代,可以将大量蛋白质与特定的基因序列关联起来——甚至与特定功能相关联,前提是那些基因的突变已被证明具有特定的表型后果。
  5. 对复杂混合物中的单个肽提供了更多识别信息的重要改进,从而极大地促进了来自大型基因组的蛋白质的鉴定,是液相色谱-串联质谱(LC-MS/MS)的发展,在这种技术中,肽通过液相色谱分离,然后在质谱仪中通过碰撞诱导解离(CID)进行片段化,以及促进序列数据库自动化搜索的算法。
  6. 自那以后,许多设计上的改进提高了质谱仪的灵敏度和质量准确性。

Intracellular protein tagging followed by AP

细胞内蛋白质标记随后进行亲和纯化

Para_02
  1. 除了仪器的进步之外,在细胞提取物的制备之前,在天然宿主细胞中表达带有标签的蛋白质,然后使用与该标签结合的固定化试剂纯化带标签的蛋白质及其相互作用蛋白,以便通过质谱法进行鉴定,这一过程具有重要的优势。
  2. 首先,使用天然宿主通常可以避免当蛋白质在异源系统中过量表达时常见的蛋白质不溶性问题。
  3. 其次,带标签的蛋白质将获得其天然的翻译后修饰,这些修饰可能有助于蛋白质的溶解性和/或某些相互作用蛋白的结合。
  4. 第三,蛋白质将在其天然分子伴侣和共分子伴侣的存在下合成,这可能是其正确折叠所必需的。
  5. 最后,如果编码标签的DNA被整合到通常编码该蛋白质的基因中,以标记蛋白质的N端或C端,则该带标签的蛋白质将以正常水平表达——从而可能避免因蛋白质过量表达导致的人工相互作用——尽管在某些情况下可能需要蛋白质过量表达以防止解离并检测弱相互作用。
  6. 结合质谱法进行蛋白质鉴定,这一程序被称为亲和纯化和质谱分析(AP-MS)(图2A)。
  • 图2. 检测蛋白质-蛋白质相互作用的方法 (A) 亲和纯化与质谱法 (AP-MS)。(B) 共分级质谱法 (CF-MS)。
  • 改编自 Richards 等人

Biological insights from AP-MS

AP-MS 的生物学见解

Para_02
  1. 因为酿酒酵母 S. cerevisiae 和最终的大肠杆菌 E. coli 的染色体内蛋白质标记相对容易进行,因此可以对这些生物体中的几乎所有蛋白质进行亲和纯化-质谱(AP-MS)分析。
  2. 使用"串联亲和纯化(TAP)标签"(由两个通过烟草蚀刻病毒[TEV]切割位点分隔的标签组成)和两次连续的 AP 步骤,可以轻松地将标记蛋白及其相互作用者纯化至接近均一的状态。
  3. 这种方法使得从酵母和大肠杆菌中系统性地、全基因组范围地鉴定蛋白质-蛋白质相互作用(PPIs)和蛋白质复合物成为可能。
Para_03
  1. 同一蛋白复合物中存在各种蛋白质意味着它们具有共同的或至少部分重叠的功能,即‘负罪关联’。
  2. 因此,酵母蛋白复合物的鉴定导致了对酵母染色质生物学及分子生物学其他方面的大量见解(例如,Bouveret 等人,Miller 等人,Pijnappel 等人,Krogan 等人,Krogan 等人,Dziembowski 等人,Krogan 等人,Kim 等人,Keogh 等人)。
  3. 例如,通过 COMPASS(与 Set1 相关的复合体蛋白)获得了关于组蛋白甲基化的见解,这是第一个被纯化的组蛋白甲基转移酶复合体,以及通过 SET3 复合体获得的组蛋白去乙酰化机制的见解。
  4. 另一个发现是存在两种含有 Rpd3 的组蛋白去乙酰化复合体,一种在启动子区域发挥作用,另一种在转录区域发挥作用。
  5. 另一个进展是识别出有一种专门的染色质重塑复合体可以将组蛋白 H2A 替换为其变体 Htz1。
  6. 其他研究提供了关于 DNA 修复控制和 RNA 聚合酶 II 转录终止的见解。
Para_04
  1. 今天,亲和纯化(AP)技术与现代质谱(MS)及其伴随的生物信息学程序相结合,使得单次 AP 步骤通常足以明确鉴定出后生动物肽,因此也鉴定出了带有标签的蛋白质及其各种相互作用者。
  2. 对大量不同的蛋白质进行融合相同标签的纯化,会产生一个相对均匀的背景污染物,这些污染物要么结合到了标签上,要么结合到了用于纯化的基质上。
  3. 此外,参照 AP 中常见污染物的数据库(结合使用如 SAINTexpress、CompPASS 和 MiST 等统计算法),通常可以区分真正的相互作用者和各种污染物。
  4. 使用这些或类似的方法,基于 AP-MS 的后生动物蛋白质互作网络已为约 5,000 种果蝇蛋白和来自 ORFeome 收集的人类细胞系中多达约 5,000 种编码蛋白质的 cDNA 生成。
  5. 这些以及许多其他人类蛋白质互作关系和从各种小规模研究中得出的蛋白质复合物已被编入 CORUM、InWeb_IM 和 BioGRID 等各种数据库中。
Para_05
  1. 因此,已经解析了大量的人类蛋白质复合物或"社区",现在涵盖了大多数人类蛋白质。
  2. 此外,AP-MS 程序可用于比较不同细胞类型、各种扰动和导致疾病的突变对 PPIs 的影响。
  3. 例如,大规模的 AP-MS 实验增加了我们对信号通路的理解,其中一些可以直接与疾病状态联系起来。
  4. 对 300 种人类激酶的 PPIs 映射确定了约 7,000 个相互作用,涉及 2,379 种独特的蛋白质。
  5. 这一数据集提供了对理解不足的激酶的见解,包括将激酶 PIM3 和 POMK 分别与细胞骨架调节和糖蛋白处理联系起来,并且还发现了几种激酶与多个疾病领域之间的先前未被认识的联系。
  6. AP-MS 研究还揭示了 PTMs 在介导 PPIs 中的重要性,包括探索涉及 Hippo 信号通路中蛋白质的相互作用的努力,该通路调节细胞增殖和免疫系统功能的各个方面,并与癌症以及心血管系统功能和疾病有关。
  7. 用磷酸酶抑制剂处理提取物后鉴定出的 PPIs 揭示了由 STRIPAK 激酶复合物和 Hippo 通路中的 MST1/2 激酶介导的磷酸化依赖性相互作用。
  8. 此外,在加入磷酸酶抑制剂后进行的 AP-MS 实验发现了涉及该系统的关键支架蛋白 MOB1A 的其他差异相互作用。
  9. 关于此类差异物理相互作用的进一步讨论,请参见下文。

Limitations of PPI identification by AP-MS

AP-MS 识别 PPI 的局限性

Para_02
  1. 正如上文所述,AP-MS 用于识别人类蛋白质-蛋白质相互作用的一个重要限制是,一些相互作用可能是由于标记蛋白的过表达所导致的假象。
  2. 事实上,通过染色体内标记生成的 S. cerevisiae 和 E. coli 的网络与通过蛋白质过表达生成的网络重叠度不高。
  3. 可以使用 CRISPR 技术对人类蛋白质进行染色体内标记来避免蛋白质过表达,这已经对有限数量的人类蛋白质进行了尝试。
  4. 另一方面,一些具有体内相关性的相互作用可能非常微弱,以至于在亲和纯化过程中被洗脱掉,而这些相互作用可能通过蛋白质过表达得以保留。
  5. 另一个问题是,所有使用全细胞提取物的方法,包括蛋白质亲和层析、下拉实验、免疫沉淀和 AP-MS,在全细胞提取物中可能存在的某些蛋白质相互作用实际上在体内永远不会发生,因为它们总是定位在不同的细胞区室或从未同时表达。
  6. 然而,在缺乏预先存在的遗传数据(例如来自全基因组关联研究的数据)的情况下,目前只有耗时且低通量的生化和遗传方法可用于解析因蛋白质过表达或使用细胞提取物而发现的蛋白质-蛋白质相互作用是否具有生物学意义。
Para_03
  1. PPIs 在后生动物中存在的许多特化细胞类型之间差异很大。
  2. 此外,它们还可以在发育过程中、响应环境刺激以及细胞周期的不同阶段发生变化,而在所有这些情况下进行全基因组标记随后进行 AP-MS 将是极其艰巨的任务。
  3. 本综述的下一部分将讨论解决此问题的方法。
  4. 另一个问题是膜蛋白的挑战,它们不溶于通常用于制备细胞提取物的缓冲液中。
  5. 为此,使用了温和的去污剂,可以在不解离蛋白质复合物的情况下使膜蛋白溶解。
  6. AP-MS 和大多数其他用于鉴定 PPI 的生化方法的一个共同问题是,观察到的 PPI 是否是直接的,还是由同一蛋白质复合物中的另一种蛋白质间接介导的(图 2A);这个问题也可以通过下面讨论的方法来解决。

Protein co-fractionation followed by MS to characterize protein complexes

Para_01
  1. 在早期的蛋白质纯化过程中,如果多肽在一系列纯化步骤中共洗脱,则认为它们可能是同一蛋白质复合物的组分。
  2. 这一原理被用于开发共分级-质谱(CF-MS),在此方法中,柱层析得到的级分中的蛋白质用胰蛋白酶消化,然后通过串联质谱进行鉴定和定量(图2B)。
  3. 分级可以使用高分辨率离子交换层析、凝胶过滤层析、等电聚焦或疏水相互作用层析等方法进行,也可以组合使用这些方法。
  4. 算法随后检测所有可由质谱鉴定的蛋白质的共洗脱情况,例如,在小鼠大脑中,最多可鉴定出8,389种蛋白质。
  5. 共洗脱的多肽初步分配给同一蛋白质复合物,提示了多达1,030种小鼠大脑蛋白质复合物的亚基组成,其中近40%似乎是新的。
  6. 例如,一个大而新颖的蛋白质复合物包含多个与肌萎缩侧索硬化症(ALS)相关的蛋白质,似乎在剪接中起作用,并且在ALS的小鼠模型中发生改变。
  7. 其他新颖的蛋白质复合物包含与各种其他神经精神疾病相关的蛋白质。
Para_02
  1. 同样,一项研究调查了被巨大噬菌体感染的细菌中的复合物,发现了大量与巨大噬菌体捕食有关的新噬菌体-噬菌体和噬菌体-细菌蛋白质相互作用。
  2. CF-MS 特别适合用于研究被病原体感染的细胞,因为它避免了对宿主和病原体的所有蛋白质进行标记和纯化以进行质谱分析的需求。
  3. 此外,它可以不仅研究病原体-病原体和病原体-宿主之间的相互作用,还可以研究病原体对宿主蛋白质相互作用网络和蛋白质复合物的间接影响。

Advantages and limitations of CF-MS

CF-MS的优点和局限性

Para_03
  1. 因为两种蛋白质的同时纯化可能是偶然的,因此通过与已知的蛋白质-蛋白质相互作用(PPIs)和蛋白质复合物进行比较来验证由 CF-MS 识别的 PPIs 和蛋白质复合物是非常重要的。
  2. 例如,在人类乳腺癌和非转化细胞系中通过 CF-MS 识别的 25,235 个 PPIs 中的 18,774 个以及 772 个蛋白质复合物中的 498 个得到了文献中先前描述的 PPIs 或各种数据库中存在的蛋白质复合物的支持。
  3. 这留下了 274 个假设的新蛋白质复合物,仍需通过其他方法进行验证。
  4. 同样,由于通过 AP-MS 识别的 PPI 可能是由蛋白质过表达人为引起的,因此使用 CF-MS 来验证通过 AP-MS 识别的 PPI 也非常重要。
  5. 因此,AP-MS 和 CF-MS 应该是高度互补的,系统地追求这两种类型的研究有望最终导致对人类蛋白质复合物组成及其在不同细胞状态下的变化的高度可靠描述。
Para_04
  1. CF-MS 的一个重要限制是 MS 无法检测细胞或组织中存在的所有蛋白质,这一限制可能随着 MS 技术的进步而得到解决。
  2. 此外,在所有 CF-MS 研究中,有时会在不同的色谱图中发现同一种蛋白质出现在多个峰中。
  3. 这可能反映了该蛋白质存在于多个蛋白质复合物中,或者在柱层析过程中蛋白质复合物部分解离成多种亚型,这个问题也可能通过 AP-MS 解决。
  4. 然而,与 AP-MS 不同,CF-MS 方法的优势在于不使用可能破坏蛋白质复合物的标签或抗体。
  5. 它还具有这样的优势:通过使用质量标签对不同细胞群体中的蛋白质进行差异标记,然后将提取物混合进行柱层析和质谱分析,可以定量比较不同细胞类型或处理方法,例如在 SILAC 方法中,或者通过分别层析提取物并使用如 SWATH-MS(顺序窗口采集所有理论质谱)等数据非依赖性采集(DIA)质谱方法。
  6. 通过使用 6 重或甚至 18 重串联质谱标签(TMT),CF-MS 的通量可以大幅提高,从而实现质谱分析的多重化,并同时使多个样本的定量比较成为可能,减少仪器时间。

Validation of PPIs and distinguishing direct from indirect interactions

Validation of PPIs

蛋白质-蛋白质相互作用的验证

Para_01
  1. 如果通过高通量方法(如 AP-MS 或 CF-MS)鉴定出的特定蛋白质-蛋白质相互作用(PPIs)要用于进一步的研究或治疗药物的开发,它们需要被验证。
  2. 如果遗传学研究已经表明相互作用的伙伴是同一生物系统的一部分,并且相互作用的伙伴存在于相同的细胞内隔室,则检测到的 PPIs 更可能是有效的。
  3. 如果它们的表达在不同细胞类型和细胞扰动中相关,如果它们在细胞提取物中的热稳定性高度相关,特别是如果它们通过独立的方法得到验证,那么它们也更可能是有效的。
Para_02
  1. 已经开发了多种方法用于特定蛋白质-蛋白质相互作用(PPI)的直接验证。
  2. 最常用的方法是 IP-Western,通过使用固定化的抗体拉下诱饵蛋白后,通过免疫印迹检测到相互作用的猎物蛋白。
  3. 这种方法并不能排除蛋白质-蛋白质相互作用是间接的,可能涉及额外的蛋白质或核酸来支持相互作用,或者是人为的,即这种相互作用仅在细胞裂解后的体外发生。
Para_03
  1. 已经开发了其他方法来确定提议的相互作用是否在体内发生。
  2. 其中一种方法涉及体内从与诱饵蛋白融合的荧光(FRET)或生物发光(BRET)供体到与猎物蛋白融合的FRET受体的共振能量转移(RET)。
  3. 供体刺激后,受体发出的光取决于受体和供体之间的物理距离,因此也取决于蛋白质-蛋白质相互作用(PPI)。
  4. 另一种方法是在固定细胞中进行邻近连接分析(PLA)。
  5. 潜在相互作用的蛋白质通过抗体检测,每个抗体都与寡核苷酸融合。
  6. 当蛋白质,因此也是抗体,彼此接近时,单链DNA分子可以桥接寡核苷酸,并通过滚环扩增创建检测相互作用的底物。
  7. 其他重要的创新包括开发了邻近标记方法,如使用工程化生物素连接酶基的BioID和TurboID,或工程抗坏血酸过氧化物酶(APEX)来检测体内潜在的蛋白质-蛋白质相互作用(PPI)。
  8. 这些方法依赖于表达一种融合蛋白,其中诱饵蛋白与能够被刺激以导致附近蛋白质生物素化的酶融合。
  9. 然后可以通过链霉亲和素珠纯化生物素化的蛋白质,并通过质谱法鉴定,这些方法已被广泛用于鉴定存在于各种细胞区室和亚区室中的蛋白质。
  10. 然而,被生物素标记的蛋白质可能足够远,以至于它们不一定是同一蛋白质复合物的组成部分。
  11. 最近,描述了一种复杂的方法,该方法利用分裂内含肽的蛋白质转剪接,在诱饵蛋白中安装一个光激活催化剂;这允许在分离的细胞核中进行短程邻近标记,更有可能检测到同一蛋白质复合物中的伙伴。
  12. 然而,这些方法都无法区分蛋白质-蛋白质相互作用是直接的还是由同一蛋白质复合物的另一个组分介导的。

Distinguishing direct from indirect interactions

区分直接与间接相互作用

Para_01
  1. 考虑到开发通过增强或干扰因疾病相关突变而受到影响的蛋白质-蛋白质相互作用(PPIs)的药物的可能性(见下文),通常重要的是要知道通过亲和纯化-质谱(AP-MS)或化学足迹-质谱(CF-MS)鉴定出的PPIs是直接的还是由中介蛋白甚至核酸介导的。
  2. 最明显的方法是制备这些蛋白质的重组版本,并测试它们在体外的相互作用。
  3. 除了生物化学方法之外,还开发了几种遗传系统来识别二元PPIs,首先是酵母双杂交(Y2H)系统。
  4. 在Y2H系统中,两种蛋白质在酿酒酵母S. cerevisiae中表达,一种蛋白质与酵母激活蛋白Gal4的DNA结合域融合,另一种与Gal4的激活域融合。
  5. 两种感兴趣的蛋白质之间的相互作用导致一个或多个含有上游Gal4结合位点的报告基因被激活。
  6. 随后对Y2H框架的各种改进使得筛选数百万潜在PPIs成为可能(例如,对于人类蛋白质,如果忽略剪接变体,需要筛选的蛋白质对的潜在数量约为2×10^8)。
  7. 最终,编码17,408种不同人类蛋白质的cDNAs相互筛选,结果鉴定了涉及9,094种蛋白质的56,406个二元PPIs,这些PPIs通过正交二元相互作用测定法得到了验证。
  8. 这相当于估计存在的二元人类PPIs的大约2%到11%。
  9. 早期的一项Y2H努力覆盖了大约一半的搜索空间,恢复了在蛋白质数据库中发现的多聚体结构中的约27%的PPIs。
  10. 然而,Y2H方法不太可能成功检测到大型蛋白质复合物中的许多PPIs,而且蛋白质数据库强烈偏向于较小蛋白质复合物(如二聚体)而非大型蛋白质复合物的结构。
  11. 随着低温电子显微镜(cryo-EM)用于产生越来越多的蛋白质复合物的高分辨率结构,这一趋势正在改变。
Para_02
  1. 从分裂泛素系统开始,许多其他基于分裂蛋白的二元系统已经开发出来,这些系统的两个片段通过两个融合了分裂蛋白片段的蛋白质之间的相互作用而聚集在一起进行读出。
  2. Y2H系统的局限性之一是蛋白质-蛋白质相互作用(PPIs)必须发生在细胞核中,而分裂蛋白系统的PPIs原则上可以定位于其他细胞区室。
  3. 事实上,分裂泛素系统的一个版本被专门设计用于检测定位于细胞膜的PPIs。
  4. 尽管有用,但使用Y2H和分裂蛋白系统可能会错过相当一部分PPIs,因为融合伙伴可能干扰PPI或其中一个蛋白质融入复合物的过程。
  5. 此外,如果相互作用的蛋白质需要分子伴侣或特定细胞类型的后翻译修饰(PTMs)才能结合,一些PPIs也可能会被错过。
  6. 最后,当大型蛋白质复合体由多个弱PPIs稳定时,二元方法通常可能无法检测到PPIs。
Para_03
  1. 为了利用直接蛋白质-蛋白质相互作用(PPIs)进行治疗,能够可视化这些相互作用表面的能力也将是关键。
  2. 现在,通过亲和纯化(AP)分离出的大蛋白复合物中,靠近的多肽链可以使用交联质谱(XL-MS)技术相当可靠地识别出来。
  3. 在这个过程中,分离出的蛋白复合物会用一种双功能化学交联试剂处理,通常是针对赖氨酸或羧基的试剂。
  4. 在用胰蛋白酶消化后,通常还会对交联肽进行亲和纯化,然后通过液相色谱-串联质谱(LC-MS/MS)确定交联肽的序列。
  5. 该程序通常作为冷冻电子显微镜(cryo-EM)结构测定的辅助验证方法(见下文)。
  6. 重要的是,如果细胞在通过AP分离蛋白复合物之前就用交联试剂处理过,那么交联则表明了体内发生的PPIs。
  7. 此外,这种方法的使用还可以使识别那些无法在AP所需洗涤中存活的弱PPIs成为可能。
  8. 最后,XL-MS应有助于科学家识别介导两种蛋白质之间接触的表面,这对于设计旨在破坏该界面的药物开发至关重要。
  9. 发展无需标签即可在全蛋白质组范围内识别交联肽的方法是一个活跃的研究领域。

Use of AP-MS with wild-type and mutant human and viral proteins for insights into disease

Para_01
  1. 一个新兴的前沿领域是评估蛋白质-蛋白质相互作用(PPIs)的时间和空间变化。
  2. 人们希望了解在细胞的不同部分蛋白质相互作用是如何改变的,以及当条件变化时,这些相互作用如何随时间而变化。
  3. 例如,最近的研究集中在DNA损伤响应期间和干细胞分化过程中PPI的变化。
  4. 还可以揭示与疾病状态相关的特定突变的影响。
  5. 例如,使用与神经退行性疾病相关的蛋白质变体生成了PPI网络,包括阿尔茨海默病(AD)、亨廷顿病和帕金森病。
  6. 许多蛋白质在比较突变体与其相应的野生型蛋白时显示出差异结合。
  7. 例如,与早发性AD相关的淀粉样前体蛋白(APP)的突变形式K670N/M671L,在与线粒体呼吸链的重要调节因子LRPPRC的相互作用中发生了改变。
  8. 据报道,这种变化会导致线粒体功能障碍,这一表型与AD相关,证明这种方法可以阐明神经逻辑障碍的生物学基础。
Para_02
  1. 对于许多致癌突变,包括RAS功能获得错义突变和PP2A磷酸酶突变,也进行了差异AP-MS实验。
  2. 最近的工作系统地分析了与乳腺癌和头颈癌最常见突变相关的PPIs在多种细胞类型中的影响。
  3. 这揭示了涉及关键致癌驱动因素(如BRCA1和PIK3CA)的大量突变特异性和细胞类型特异性PPIs。
  4. 例如,最常见的两种头颈癌突变发生在PIK3CA的螺旋域(E542K和E545K),导致该酶对上游作用的酪氨酸激酶HER3的亲和力增加。
  5. 有趣的是,PIK3CA和HER3之间更紧密的物理连接似乎与体内对HER3抑制的更强反应相关,表明PPI图谱的数据可能具有临床意义。
Para_03
  1. 类似的方法被用于约100个自闭症谱系障碍(ASD)风险基因,揭示了1800个蛋白质-蛋白质相互作用(PPI),其中绝大多数以前未曾报道。
  2. 总共将54个患者来源的错义变异引入特定蛋白进行后续的AP-MS分析,与野生型比较后创建了一个ASD突变差异相互作用图。
  3. 转录因子FOXP1中的一个突变导致其与结合伙伴FOXP4的相互作用丧失,在脑类器官中引发了多种神经元表型,包括基底板神经元的增加,这与已知的ASD生物学特征一致。
  4. 这些结果表明,差异PPI图可以用来优先考虑可能作为可操作治疗靶点的疾病突变(见下文)。
Para_04
  1. 在这两组研究中,也观察到了聚合现象,即最初的变异基因集合可以减少到更少的复合体和通路,因为相应的蛋白质之间观察到了高度的连接性,从而证明了蛋白质-蛋白质相互作用图谱如何有助于解释疾病基因发现工作。
  2. 事实上,如果基因发现分析不是在单个基因水平上进行,而是使用蛋白质复合体和功能通路来进行,这样可以检测到这种生物学上的聚合(图3A)。
  • 图3. 使用PPI图谱解释疾病遗传学并提供有价值的治疗见解 (A) 尽管在全基因组关联研究中通常只有少数基因能够达到显著性水平,但PPI数据可以帮助解释疾病基因发现的结果。
  • 多个遗传变异的物理相互作用图谱,每个变异在疾病人群中很少观察到,通常会影响网络的同一区域,突出显示显著受影响的途径。
  • (B) 提出的用于分析与疾病相关的突变的蛋白质组学、遗传学和结构管道。
  • (C) 差异突变PPI网络可以告知药物模式和治疗方法。
Para_04
  1. 最后,差异亲和纯化-质谱(AP-MS)实验也可以用于评估与病毒变体相关的突变的影响。
  2. 例如,对主要 SARS-CoV-2 变体中观察到的个别突变进行的系统研究揭示了病毒如何进化以克服细胞防御机制以及治疗方法,从而在感染过程中有效地劫持宿主。

Biochemical resolution and functional understanding of protein machines and complexes

Para_01
  1. 现在我们可以设想,在时间和适当资源的支持下,所有稳定组装的蛋白质复合体都可以通过亲和纯化(AP)进行分离,并通过质谱(MS)鉴定其蛋白质组成。
  2. 尽管蛋白质复合体的亚基组成甚至其功能可能因细胞类型而异,但 CF-MS 能够揭示特定细胞类型的特征性亚基组成——从而确定用于每种蛋白质复合体纯化的特定细胞类型。
  3. 然而,蛋白质复合体通常存在多种形式。
  4. 即使在同一细胞中,也可能存在具有不同但重叠亚基组成的多种蛋白质复合体版本。
  5. 一个例子是在酿酒酵母 S. cerevisiae 中至少存在两种不同的含有催化亚基 Rpd3 的组蛋白去乙酰化酶复合体。
  6. 其中较大的复合体 Rpd3L 在特定启动子处抑制转录起始,而较小的复合体 Rpd3S 则作为抑制转录区域中意外转录起始途径的一部分发挥作用。
  7. 在一项研究中,这两个复合体通过传统的生物化学分级分离出来;而在另一项研究中,通过将 AP 标签放置在每个复合体特有的亚基上实现了复合体的分离。
  8. 这些研究表明,可以使用互补的生物化学方法来解析包含重叠蛋白质的复合体组成。
  9. 这种类型应用的一个更复杂的版本是由人类 SWI/SNF 染色质重塑复合体(BAF 复合体)所展示的,这些复合体在癌症中经常发生突变,并且与神经发育障碍有关。
  10. 存在许多不同版本的 BAF 复合体,但它们不仅可以通过生物化学方法,还可以通过结构方法从彼此中分辨出来。
Para_02
  1. 从一组定义的基因中获得蛋白质复合物列表至关重要,但下一步重要的是理解这些复合物的功能。
  2. 当如此多的复合物仍然神秘莫测时,如何决定要关注哪些复合物?
  3. 很多帮助可以来自对特定蛋白质复合物所在细胞类型和区室的知识,以及这些复合物组分突变对分子、细胞和有机体现型的影响。
  4. 然而,当这些数据缺失时,可以提出优先考虑那些怀疑作为蛋白质机器功能的复合物的理由。
  5. 蛋白质机器通常由十个或更多基因产物组成。
  6. 其核心功能是利用能量驱动单向构象变化,这可以使复合物作为马达、时钟和装配因子发挥作用。
  7. 虽然细胞中含有许多已深入研究的分子机器,但还有数百种结构和功能未知的分子机器。
  8. 因为导致蛋白质构象方向性变构变化所需的自由能变化通常来自于高能键(例如,ATP 或 GTP)的水解,保守的核苷酸结合位点可以帮助识别可能表现出类似机器行为的蛋白质复合物。
  9. 这样的蛋白质复合物预计会根据是否结合了 ATP、ADP+Pi、ADP 或没有核苷酸而转换到不同的构象集合之间。
Para_03
  1. 剖析每种蛋白质机器功能的标准方法通常需要使用纯化的组分重构该系统,这一过程通过使用蛋白质纯化标签大大简化。
  2. 这随后允许对机器反应的生物化学进行详细分析,通过对其不同组分的扰动后,利用各种动力学和化学分析。
  3. 但预期的不同构象之间的转变使蛋白质机器成为日益强大的冷冻电镜技术的主要目标。
  4. 这种方法以前已被用于分析蛋白质复合物在多个状态之间转换的过程,尽管实验非常困难。
  5. 如今,一旦PPI实验确定了一个特别感兴趣的复合物,它通常可以直接通过AP捕获到冷冻电镜网格上。
  6. 冷冻电镜技术的其他进展现在可能使得从混合物中存在的一系列不同构象来确定蛋白质复合物的"构象景观"成为可能。
  7. 操纵ATP和模仿各种结合核苷酸状态的配体可以增加这些景观为新型蛋白质机器提供的信息量。
  8. 经典的蛋白质亲和层析技术也可以用于分离和筛选结构分析中弱结合的‘辅助蛋白’的影响。
  9. 因此,冷冻电镜技术的最新突破有望极大地加快我们对类似机器的蛋白质复合物功能的理解。
  10. 最后,可以希望改进的技术能够系统地应用于所有复合物,以确定它们在细胞中的位置、不同的构象以及最终的功能,这些技术允许在整个细胞的切片中确定蛋白质复合物的不同构象,使用低温电子断层扫描(冷冻-ET)。

How AI and cryo-EM, in conjunction with AP-MS and CF-MS, can impact the development of PPI-directed therapies

Para_01
  1. 为了从差异蛋白质相互作用(PPI)数据集中提取生物学和治疗价值,了解哪些突变通过直接影响特定界面而干扰 PPI 是有价值的。
  2. 然而,来自亲和纯化-质谱(AP-MS)研究的数据的一个主要问题是,很难确定哪些 PPI 反映了直接相互作用,而哪些是间接并通过其他蛋白质介导的(图2)。
  3. 交联分析通过交联质谱(XL-MS)和使用冷冻电子显微镜(cryo-EM)的结构测定都能解决这个问题,但这些方法要么繁琐(cryo-EM),要么缺乏全面性(XL-MS),特别是在考虑评估大量致病突变对 PPI 影响的需求时。
  4. 如果未来实验和计算方法的创新使得能够识别所有或几乎所有的交联肽,即使是一些相对丰度较低的肽,那么这些问题中的一些将会得到解决。
Para_02
  1. 幸运的是,最近使用基于人工智能的方法进行蛋白质结构预测的进展已经开始对理解和优先处理蛋白质-蛋白质相互作用(PPIs)产生深远的影响。
  2. 最值得注意的是,AlphaFold在预测蛋白质结构方面变得越来越准确,而且这些方法正在被扩展用于更成功地预测PPIs。
  3. 例如,Lim等人通过使用AlphaFold筛选与DNA代谢相关的蛋白质之间的PPIs,发现了之前未知的DONSON复合体,并证明了它对于真核生物DNA复制的有效启动是必需的。
  4. 此外,AlphaFold已被用于帮助预测从亲和纯化-质谱(AP-MS)衍生出的涉及自闭症相关蛋白质的PPIs中哪些是直接的,从而有助于识别与疾病状态相关的新型蛋白质。
  5. 此外,确定那些位于AlphaFold预测的直接PPI界面中的疾病突变将允许优先考虑应使用靶向遗传学研究和基于结构的努力(如冷冻电镜)进一步详细研究的相互作用和突变(图3B)。
Para_03
  1. 这种综合方法不仅应该识别出新的药物开发靶点,以治疗遗传定义的疾病,还应提供如何‘瞄准’这些靶点的见解。
  2. 例如,导致新相互作用的引入或先前存在的相互作用增强的突变(如,PIK3CA 的 E542K 或 E545K 突变增强了其与 HER3 的相互作用;见上文)表明,抑制相互作用伙伴的功能可能代表了一种有效的治疗策略。
  3. 另一方面,如果突变干扰了一个相互作用,通过分子胶复活蛋白质-蛋白质相互作用(PPI)可能是有利的(图 3C)。
  4. 正如最近其他人所综述的那样,通常可以通过双功能蛋白水解靶向嵌合体(PROTACs)和分子胶降解剂来利用 PPI 数据进行治疗。
  5. 此外,开发能够准确预测哪些化合物将特异性地与 PPI 接口相互作用的基于人工智能的方法可能会被证明是有价值的。

How AI and XL-MS may revolutionize the genome-wide identification of PPIs in the future

AI 和 XL-MS 如何可能在未来革新全基因组范围内的蛋白质-蛋白质相互作用(PPIs)的识别

Para_04
  1. 在未来,快速而系统地生成高分辨率、全面的蛋白质-蛋白质相互作用(PPI)图谱将具有优势,无论是在生物体中还是在不同条件下,包括存在特定压力、药物或致病突变的情况下,甚至可能实现单细胞分辨率。
  2. 虽然目前这还不可能,但未来人工智能和交联质谱技术的发展可能会使接近这些目标成为可能。
  3. 例如,可以设想进一步开发基于AlphaFold的方法,这些方法被用于对接相互作用的蛋白质对,首先用于识别所有预测与一个诱饵蛋白相互作用的人类蛋白质,然后扩展到搜索所有可能的成对相互作用。
  4. 当然,评估所有约2亿种可能的人类成对PPI的计算成本,至少现在来说,将是巨大的,而且最初的结果将无法考虑到选择性剪接的影响以及大量调节PPI的翻译后修饰(PTMs)。
  5. 此外,考虑蛋白质复合物中涉及多于两个蛋白质的可能协同相互作用也将是困难的。
  6. 即使有这些重要的限制,这种信息,即便现在,也在显著减少时间和资源,因为这些计算方法有效地优先考虑了直接且功能相关的PPI。
Para_05
  1. 实现这一目标的一个目前更为可行的方法是在每列分数上进行 CF-MS 后再进行 XL-MS,以提供来自各种类型细胞提取物的蛋白质相互作用景观的概览。
  2. 这种方法可以解决偶然共分馏的非相互作用蛋白的问题,并且还可以提供关于相互作用蛋白拓扑结构的信息。
  3. 将这种实验分析与包括 AlphaFold 在内的人工智能方法结合,理论上可以帮助完善从 XL-MS 得到的数据集,从而提供一个全面的蛋白质相互作用景观视图(图 4)。
  4. 质谱分析的灵敏度正在不断提高(包括单细胞分辨率),因此,理论上,这种方法甚至可以在单细胞分辨率下进行,但相关仪器的灵敏度需要大幅提高。
  5. 即使这种方法提供了较低分辨率的视图,数据也可以帮助识别和优先考虑关键复合体和见解,这些信息可以指导更针对性的功能和结构研究。
  • 图4. 使用 CF、XL-MS 和 AI 方法生成全球高分辨率蛋白质-蛋白质相互作用(PPI)图谱的愿景 细胞裂解后的柱分馏结合 XL-MS,将提供一个全球性的,尽管分辨率较低的蛋白质-蛋白质相互作用和蛋白质复合物的视图。
  • 当使用包括 AlphaFold 在内的 AI 方法对管道多个点生成的数据集进行处理时,可以实现更高的分辨率。
Para_05
  1. 令人兴奋的是,正在开发使用 XL-MS 的方法来识别分离的细胞器中的交联肽,甚至在用膜渗透性交联试剂处理后的整个细胞中。
  2. 这些方法应该能够克服许多与提取物中虚假结合和未能捕捉瞬时相互作用相关的关键限制。
  3. 这些方法可以识别蛋白质拓扑结构以及蛋白质-蛋白质相互作用,但是否可以使这些方法足够敏感以识别整个细胞或甚至分离的细胞器中的几乎所有蛋白质-蛋白质相互作用仍有待观察。

Conclusions

结论

Para_04
  1. 过去,人们尝试直接从疾病相关基因组测序努力中获得的基因和突变中提取生物学和治疗学见解。
  2. 然而,简单来说,从序列信息中可以提取的见解是有限的,对特定疾病领域的进一步测序努力往往收益递减。
  3. 重要的是,细胞的功能单元是蛋白质,它们通常通过物理相互作用进行交流。
  4. 这些连接以及蛋白质最终形成的分子机器几乎参与了细胞的所有功能。
  5. 此外,与疾病相关的突变通常会干扰蛋白质的功能及其相互作用,而绝大多数开发用于治疗疾病的疗法都是针对蛋白质的。
  6. 因此,为了理解健康的生物学并最终治疗疾病状态,对蛋白质-蛋白质相互作用(PPIs)的深入和机制性理解至关重要。
  7. 虽然蛋白质-蛋白质相互作用的研究已经存在近半个世纪,但实验和计算方法整合方面令人兴奋的最新进展提供了前所未有的方式,以高分辨率视角识别和表征由疾病导致的突变影响的稳态PPIs,这种视角以前是不存在的。
  8. 这些观点,从数据丰富、集成的管道中浮现出来,将开启一个识别和理解PPIs的新时代,这将被利用来更深入地理解健康和疾病的分子生物学,以及为各种疾病开发新的治疗方法。

Acknowledgments

Para_01
  1. 作者感谢 Manon Eckhardt 在科学编辑和图设计方面的帮助,Alicia Richards 在文献回顾方面的帮助,以及 David Agard、Matthew State、George Scangos 和 Kevan Shokat 的宝贵讨论。
  2. 这项工作得到了美国国立卫生研究院(U19AI135990、U54AI170792、U54CA274502、1OT2OD032742 和 U19AI135972)对 N.J.K. 的资助,以及加拿大卫生研究院(FDN-154338)对 J.F.G. 的资助。
  3. 这项工作还得到了国防高级研究计划局(DARPA)的合作协议 #HR-0011-19-2-0020 和 #HR-0011-20-2-0029 的支持。
  4. 本材料中包含的观点、意见和/或发现均为作者的观点,不应解释为代表国防部或美国政府的官方观点或政策。

Declaration of interests

Para_01
  1. Krogan 实验室已从 Vir Biotechnology、F. Hoffmann-La Roche、Maze Therapeutics 和 Rezo Therapeutics 获得了研究支持。
  2. N.J.K. 是 Rezo Therapeutics 的董事会成员,并且他是 Tenaya Therapeutics、Maze Therapeutics、Rezo Therapeutics、GEn1E Lifesciences 和 Interline Therapeutics 的股东。