随着测序技术的进步,已经发现了大量的与人类疾病相关的编码变异,这些变异大多数被归类为意义不明的变异(VUS),这对临床解释编码变异构成了重大障碍。即便某个编码变异被认为具有致病性,通常也不清楚它如何具体破坏蛋白质功能【1】。因此,研究编码变异对蛋白质功能影响具有重要的临床遗传学意义,有助于理解疾病发病机制和发展新的治疗方法。由编码变异引起的疾病非常多样,影响不同的细胞过程、组织类型和发育阶段,而编码变异破坏蛋白质功能的分子机制通常为影响蛋白质稳定性、生物分子相互作用或蛋白质亚细胞定位。其中,蛋白质稳定性的丧失是最常见的原因之一。相比之下,目前人们关于突变对蛋白质定位的影响却知之甚少。正确的亚细胞定位对蛋白质的功能至关重要,蛋白质定位错误在多种人类疾病中起着核心作用。然而,被预测为定位错误的致病疾病变异还不到2%【2,3】。这显然是一个严重的低估,因为准确预测定位错误是极其困难的。蛋白质定位可以由诸如特定区域的分选信号、蛋白质-蛋白质相互作用(PPI)、配体结合或蛋白质质量控制机制调节,任何这些机制的破坏都可能导致定位错误。因此,异常蛋白质定位对不同疾病的影响的程度仍然未知。近日,来自加拿大多伦多大学的Mikko Taipale团队于Cell上在线发表题为Pervasive mislocalization of pathogenic coding variants underlying human disorders 的资源型文章,建立了一个高通量成像平台,系统地分析了编码变异对蛋白质定位的影响,评估了超过1000个基因和表型的3,448个错义变异。研究发现定位错误是编码变异的常见后果,影响大约六分之一的致病性错义变异,涉及所有细胞区室,并且同样影响隐性和显性疾病以及体细胞突变,表明亚细胞定位的变化可以揭示多效性机制,并有助于对VUS进行分类。由此提供了完整的图像和数据集作为开放获取资源,以供研究罕见疾病和蛋白质运输机制的研究人员使用。为了系统性地描述遗传变异对蛋白质定位的影响,本文研究人员收集了包括1,269个独特基因的3,448个变异,基于ClinVar注释和AlphaMissense预测,高度富集致病性和破坏性变异,并广泛涵盖了常染色体隐性、常染色体显性和X连锁遗传模式的变异,以及体细胞变异和易感等位基因。研究人员构建了这些基因的带3xFLAG-V5标签的载体,并将其转染到HeLa细胞中,同时对细胞核、膜和内质网、线粒体的亚细胞标记进行染色,然后使用自动化高含量共聚焦显微镜进行成像,创建了一个可靠的下游分析数据集。成像后的细胞通过两位独立观察者进行视觉分析,并使用定制的CellProfiler流程进行计算分析。经过分析和评估,研究人员证明了这种蛋白质定位方法在不同细胞系之间存在一致性,在单一细胞系中使用单末端标签是研究错义变异对蛋白质定位影响的一种成本效益高且可靠的方法。利用上述方法,研究人员随后对2280个成像检测到的变体进行了系统性分析,以探究错义变异如何广泛影响蛋白质的亚细胞定位。研究结果发现,大约11%的变体(250个)表现出与参考蛋白不同的定位模式,这些变体来自152个不同的基因,意味着约16%的基因至少有一个错义变异体发生定位错误。对于通过分泌途径运输的蛋白质中的变异,这一比例至少上升到四分之一。而对于那些检测了四个或更多变体的基因,有将近40%的基因至少发现有一个变体发生了定位错误。由此证明错义变异可以影响大部分蛋白质组的定位。此外,研究还观察到,错误定位的变异在基因之间的分布并不均匀,如果一个基因有一个变异体发生定位错误,那么该基因的其他变异体也更有可能发生定位错误。因此,一些基因产物比其他基因产物更容易定位错误。在定位模式上也发现了相似的趋势,某些亚细胞区室更有可能涉及定位错误,其中59%的定位错误事件包含了分泌途径(内质网、高尔基体、质膜或囊泡)作为参考或变体的定位。与此同时,研究人员发现了一种特别的蛋白质定位错误类型,有14%的变异体(34种不同的蛋白质)在不同的参考位置形成了离散的焦点或簇。这些变异体中包括已知倾向于聚集的蛋白质以及与癌症相关的SPOP蛋白的多种体细胞变异,而且与不同肿瘤类型相关的致癌变异体展现出不同的定位表型。与其他错位变异体相比,那些因定位错误而失去或获得焦点的变异体有一些独特的特征,它们在功能上更倾向于以显性方式起作用,而且这些变异体在预测会扰乱生物分子凝聚形成的突变中显著富集,提示聚集或凝聚调控失调是变异体错位以及人类疾病发病机制的常见原因。随后,研究人员比较了定位错误变异体与定位正常变异体的特征。结果发现,显性变异体和隐性变异体以及生殖系变异体和体细胞变异体发生定位错误的比例大致相同,这表明蛋白质定位错误普遍影响所有类型的变异。与正常定位的变异体相比,定位错误变异体在预测和已知的致病变异体中显著富集,而在良性变异体中则相对缺乏,而且其在人群中的频率更低。对于通常定位在分泌途径的蛋白质,这一模式更为明显。深入分析也表明蛋白质定位是一个强有力的检测方法,可用于区分致病和良性变异体,特别是对于已经识别出定位错误致病变异体的基因。进一步地,研究人员分析了导致蛋白质定位错误的原因,发现虽然蛋白质定位错误可以由破坏了翻译后修饰位点、特定的PPI或运输信号(如核定位信号或信号肽)的变异引起,但这些情况并不是主要原因。实际上,大多数错位变异体的定位错误是由于蛋白质稳定性受损、蛋白质错误折叠或跨膜结构域(TMD)插入膜中的问题导致的。研究结果显示,错位变异体在已知的TMD中有较高比例的突变,且这些突变更倾向于非保守替换。此外,错位变异体更有可能与分子伴侣和其他细胞质量控制因子有更多相互作用,确立了蛋白质不稳定性是导致蛋白质错位的主要因素,其影响大于特定PPI的丧失。最后,研究人员探讨了成像技术如何揭示变异的致病机制和疾病的严重性。研究发现,不同表型的变异往往呈现不同的蛋白定位模式,蛋白质定位错误可能与多效性、疾病严重性和发病年龄相关。以ACTB基因的两个变异体R183W和E364K为例,它们在细胞内的定位模式与野生型ACTB有显著差异,并且与它们所导致的疾病表型有关。进一步的研究表明,E364K变异体可能因错误折叠而导致功能丧失,而R183W变异体则可能通过改变与actin相关蛋白的相互作用影响actin动态平衡。此外,研究人员还研究了癌症相关变异体SMAD2 D304G,发现其核定位增加,可能影响其转录激活潜力。这些发现表明,蛋白定位的变化可以为理解遗传变异的致病机制提供重要线索,并有助于评估疾病的潜在严重性。成像发现的异常定位变异体可以作为研究的起点,用于进一步的分子机制研究,以及作为药物发现的潜在靶点。综上所述,本研究确定了蛋白质定位错误是多种疾病基因中致病性错义变异的常见结果,回答了关于人类疾病中定位错误的频率、特征和机制的基本问题,绘制了首幅展示人类编码变异对蛋白质定位影响的大规模、公开可用的地图,可作为对每个变体、参考基因或相关人类疾病感兴趣的研究人员的重要的免费资源。原文链接:https://doi.org/10.1016/j.cell.2024.09.003制版人:十一
1. Tabet, D., Parikh, V., Mali, P., Roth, F.P., and Claussnitzer, M. (2022). Scalable Functional Assays for the Interpretation of Human Genetic Variation. Annu. Rev. Genet. 56, 441–465.
2. Taipale, M. (2018). Disruption of protein function by pathogenic mutations: common and uncommon mechanisms. Biochem. Cell Biol. 37, 508.
3. Laurila, K., and Vihinen, M. (2009). Prediction of disease-related mutations affecting protein localization. BMC Genomics 10, 122.
BioART战略合作伙伴
(*排名不分先后)
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。