Hi, guys! 好久不见,今天小编来跟大家分享一篇Genome Medicine杂志(IF=10+)发表的文章,这篇文章以慢性肾病(CKD)为研究对象,CKD是一种逐渐进展的疾病,以结构和功能损伤为特征,目前尚无有效的治疗方法。本文采用双样本孟德尔随机化(MR)、基于汇总数据的孟德尔随机化(SMR)和共定位等分析策略,整合了血浆蛋白质组和转录组数据来识别CKD和肾功能的潜在药物靶点。
添加微信
步入正文之前,咱们先简单了解几个概念。蛋白质数量性状位点(pQTL)是指与蛋白质表达水平相关的遗传变异位点,这些遗传变异可以影响特定基因的转录、翻译、或降解蛋白质等过程,从而影响人体中蛋白质水平。pQTL是基因组关联研究(GWAS)的一个分支,主要是探索基因型与蛋白质表达水平之间的关联。在本文中,顺式pQTL被定义为距离蛋白质编码基因1Mb以内的SNP,可以通过直接影响蛋白质的转录、翻译、降解、稳定性或活性来直接调节蛋白质的表达水平;而反式pQTL被定义为距离蛋白质编码基因1Mb以上的SNP,通过影响蛋白质的调控途径、转运、稳定性等间接影响蛋白质的表达水平。
一、数据来源
本文涉及的数据主要包括以下三类:
1)血浆蛋白质组数据:作者从SomaScan平台获取了4907个来自冰岛人群的适配子、3892个来自芬兰群体的蛋白质,在Olink平台获得了2923个来自UKBPPP项目的蛋白质。这三个GWASs研究共有3032 种蛋白质具有可用的顺式pQTLs,用于后续分析;
2)转录组数据:基因表达数据来源于eQTLGen数据库,本文主要分析顺式eQTLs,以确保遗传变异与基因表达变化的相关性。为了重复,作者又另外获取了2组血液样本的基因表达数据(CAGE和Westra等人的研究),并从PsychENCODE获取了1组脑样本的数据,以及GTEx数据库中的组织特异性顺式eQTLs;
3)CKD数据:慢性肾病数据主要来自CKDGen数据库,以及UKB和FinnGen。
肾功能表型的GWAS数据包括来自CKDGen和UK Biobank的eGFRcrea和eGFRcys,用于直接评估肾功能;通过一个包含42项研究的GWAS获得了2种急性肾功能衰退的表型数据;eGFR的年变化斜率来自MVP和BioVU的一项研究;
4)CKD临床类型的数据包括来自 FinnGen GWAS的慢性肾小管间质性肾炎数据,以及一项欧洲GWAS的膜性肾病数据,此外,IgA肾病、慢性肾小球肾炎、肾病综合征和糖尿病性肾病数据来自UK Biobank和FinnGen数据库。
二、研究流程
如图1所示,首先,研究通过双样本MR分析从三个血浆蛋白质组学数据集中筛选CKD的潜在蛋白质靶点,只选择顺式 pQTLs作为每种蛋白质的工具变量(IVs)。对于只有一个顺式pQTL的蛋白质,采用Wald ratio和delta法估计比值比(ORs)与相应的置信区间(CIs)。对于具有多个顺式pQTLs的蛋白质,通过逆方差加权 (IVW)方法获得估计值。该分析策略满足三个假设:IVs与暴露相关;IVs 仅通过暴露影响结果;IVs与混杂因素无关。如果蛋白质在三个数据集中都显著(q < 0.05),并且至少有一个数据集的MR估计值可用,则使用固定效应模型对该蛋白质的影响进行荟萃分析。
在转录组层面,为了进一步验证检测到的血浆蛋白靶点(q < 0.05),研究采用基于汇总的MR(SMR)方法来评估相应蛋白编码基因的表达与CKD风险之间的关系。SMR方法选择单个最显著相关的eQTL SNP,并使用依赖工具的异质性 (HEIDI) 检验来分析基因表达与结果之间的关联是否归因于遗传连锁。若HEIDI检验P-value < 0.01,则认为是由遗传连锁造成的关联。
对于IVs,作者使用“clump_data”函数来控制潜在的连锁不平衡,并使用每种蛋白质的主要顺式pQTLs进行敏感性分析。此外,组合的顺式和反式pQTLs被用作IVs来重复主要分析。对于结果,使用了其他三个CKD数据源来重复MR分析。研究还探讨了识别的蛋白质与不同肾功能、eGFR的年变化斜率以及CKD临床类型之间的关联。对于基因表达,通过另外两个包含血液样本的数据集和组织特异性数据集重复了之前的分析。此外,作者还对识别出的CKD相关蛋白质进行了共定位分析以及PPI网络分析,并对蛋白质编码基因进行了GO功能注释。最后,根据已有研究探讨所识别的蛋白质和基因是否具有药物可用性。
图1. 研究设计三、主要结果
1、CKD相关的血浆蛋白
3个数据集中CKD的重要蛋白信号如图2.A所示,经过 FDR 校正后,32个蛋白质与CKD 显著相关(q < 0.05)。其中,18种蛋白与CKD负相关,14种蛋白增加了CKD风险(图1.B)。
图2. 32种蛋白质与CKD的关联
2、蛋白质编码基因表达与 CKD 的关联
研究将这32种蛋白质映射到了29个编码基因,图3显示了29个基因的SMR分析结果,有14个基因的CKD结果与相应蛋白质一致。在这些基因中,HLA-DQA2、BTN3A2、C4A等基因与CKD风险呈负相关,而SDC-CAG8、CEP170、AGER、C4B等基因与CKD风险显著正相关。TCEA2、GMPR、PLD3等基因在不同血液或组织特异性样本中对CKD风险表现出了不同的影响,这可能反映了潜在的脱靶效应。因此,在不同组织中靶向这些基因的药物可能存在潜在的脱靶效应。
图3. 蛋白编码基因热图3、蛋白质与其他CKD、肾功能和CKD亚型的关联
图4展示了上述32种蛋白质与CKD相关表型的关联分析,除DQA2外,所有识别出的蛋白关联都在其他CKD数据中被复制。此外,10种蛋白质在早期版本的CKDGen的CKD数据中被复制,14种蛋白质在UKB和FinnGen数据集中被复制。
图4. 关联蛋白质气泡图对于肾功能,除DQA2、GNPTG和C4外,29种蛋白质与eGFRcrea显著相关;对于快速肾功能衰退,SDCCAG8、GATM等与CKDi25和Rapid3呈负相关,而sRAGE、AIF1和UMOD则与之呈正相关;IDI2与慢性小管间质性肾炎的风险降低显著相关;BTN3A2、BTN3A3和MICB可降低膜性肾病的风险,而sRAGE和AIF1则会增加这种风险;DQA2、C4a和MICB与慢性肾小球肾炎和肾病综合征的发病风险呈正相关(图5)。
图5. 32种蛋白质的关联分析4、蛋白质与CKD的共定位
在这些蛋白质中,NFATC1、PFKFB2、SDCCAG8、YOD1和FGF5等蛋白质与CKD共定位。
5、PPI、GO和单细胞富集
如图6.A所示,HLA-DQA2、HLA-E、BTN3A2、BTN3A3、MICB互作,UMOD与IGFBP-5和GATM互作,C4a与C4b和Apo A-IV互作。此外,CEP170与SDCCAG8、INHBC、INHBA(activin AC)也存在相互作用。图6.B的富集结果发现,这些基因主要在T细胞免疫、白细胞免疫、淋巴细胞免疫等通路中富集。在单细胞结果中,FGF5、IGFBP-5等富集在肾脏单细胞类型,FGF5、C4a等mRNA在肾脏组织细胞类型富集,GATM、PFKFB2等表现出免疫细胞特异性。
图6. PPI和GO富集总结一下,本研究通过MR、SMR和共定位分析等方法,发现了32种与CKD、肾功能或某些CKD临床类型相关的蛋白质,以及20种新型蛋白质,为CKD和肾功能提供了潜在的药物靶点与生物标志物。整篇文章使用的都是公共数据,分析策略也可借鉴,感兴趣的小伙伴想复现也不是难事~~~好了,今天的分享就到这了,have a nice day!
参考文献
Si S, Liu H, Xu L, Zhan S. Identification of novel therapeutic targets for chronic kidney disease and kidney function by integrating multi-omics proteome with transcriptome. Genome Med. 2024 Jun 19;16(1):84. doi: 10.1186/s13073-024-01356-x. PMID: 38898508; PMCID: PMC11186236.
封面图片
来自百度搜索
添加微信