孟德尔作为生信分析的大热点,早已成为高分必备,但是单一孟德尔的发文早已进入了瓶颈期,想要突破5+就必须寻找新的出路。在大多数人的观念中,与孟德尔结合的最佳搭档是单细胞和基因组学,殊不知转录组学用好也能从小平凡化身白天鹅。今天小编就整理了一篇孟德尔+转录组的研究文章,并介绍了研究方法与结果,这个研究方法十分简单,却轻松突破10+大关迈入高分文献行列。
慢性肾脏病(CKD)是一种全球范围内普遍存在的疾病,影响着大约10%的人口。CKD患者面临多种不良结果的风险,包括肾脏替代治疗、心血管事件和死亡。目前,CKD在临床实践中尚无有效治愈方法,因此需要新策略来延长肾脏和患者的生存时间。更深入地识别和理解参与CKD生物标志物对于鉴定潜在治疗靶标至关重要。
研究设计
研究者设计了一个综合分析流程,旨在通过整合血浆蛋白质组和转录组数据来识别CKD和肾功能的潜在治疗靶点。具体步骤如下:
数据来源:
血浆蛋白质组数据:从三个大型GWAS中获取与血浆蛋白质相关的pQTLs数据,涉及3032种蛋白质。
转录组数据:从eQTLGen联盟获取基因表达数据,重点关注顺式eQTLs。
CKD相关表型数据:包括CKD、不同CKD临床类型(如IgA肾病、慢性肾小球肾炎等)和肾功能指标。
分析方法:
两样本孟德尔随机化(MR):用于识别与CKD相关的蛋白质。仅使用顺式pQTLs作为每个蛋白质的工具变量,结果来自CKDGen(欧洲血统)。
基于摘要的MR(SMR):用于验证候选血浆蛋白编码基因的表达与CKD风险的关联。
共定位分析:用于验证识别的蛋白质与CKD共享的编码基因位点。
蛋白质-蛋白质相互作用(PPI)和基因本体论(GO)富集分析:用于探索潜在的生物学作用。
单细胞注释:用于分析蛋白质编码基因在不同细胞类型中的表达特异性。
统计分析:
MR分析:使用Wald比率和delta方法估计单个顺式pQTLs的比值比(OR)和置信区间(CI)。对于多个顺式pQTLs,使用逆方差加权(IVW)方法。
SMR分析:选择最显著相关的eQTL SNP作为工具变量,使用HEIDI测试评估基因表达与结果之间的关联是否由于连锁不平衡而非SNP通过基因表达调节疾病。
敏感性分析:通过clump_data函数控制潜在的连锁不平衡,使用主要顺式pQTLs进行另一项敏感性分析,结合顺式和反式pQTLs重复主要分析。
共定位分析:基于贝叶斯模型,评估识别的蛋白质与CKD是否共享相同的因果变异。
PPI和GO富集分析:使用STRING数据库分析蛋白质之间的相互作用,使用clusterProfiler进行基因功能注释和富集分析。
图 1 文章总体思路
1. 蛋白质与CKD的关联:
- 利用3032种蛋白质的pQTLs数据,结合3个大型GWAS和相应的血液及组织特异性eQTLs,研究者识别出32种与CKD相关的蛋白质。这些蛋白质在不同的CKD数据集、肾功能指标和临床类型中得到了验证。
- 其中12种蛋白质(如FGF5、IDI2、INHBC等)已有MR支持,20种为新发现的因果蛋白质。
- 5种新蛋白质(GCKR、IGFBP-5、sRAGE、GNPTG、YOD1)通过MR、SMR和共定位分析被确认为CKD治疗的优先蛋白质。
- 其他15种蛋白质(如GATM、AIF1L、DQA2等)也被认为是候选靶点。
图 2 孟德尔结果
2. 蛋白质与基因表达的关联:
- 32种蛋白质被映射到29个编码基因。通过SMR分析,14个基因与CKD的结果一致。其中,HLA-DQA2、BTN3A2、C4A、NFATC1和GNPTG与降低CKD风险相关,而SDCCAG8、CEP170、AGER、C4B、AIF1L、DNAJC10、YOD1、CDCD2L和MICB与增加CKD风险相关。
- 在肾脏皮质样本中,FGF5、C4a和HLA-DQA2的基因表达与CKD呈负相关。
图 3 相关性图解
3. 蛋白质与CKD亚型的关联:
- 32种蛋白质与多种CKD亚型(如IgA肾病、慢性肾小球肾炎等)的关联在不同数据源中得到了验证。例如,IDI2与降低慢性肾小管间质性肾炎风险相关,而Apo A-IV、HLA-E和AIF1与降低IgA肾病风险相关。
- BTN3A2、BTN3A3和MICB与降低膜性肾病风险相关,而sRAGE和AIF1与增加膜性肾病风险相关。
- DQA2、C4a和MICB与降低慢性肾小球肾炎和肾病综合征风险相关。
图 4 相关性点图
4. 共定位分析:
- 通过共定位分析,研究者发现NFATC1、PFKFB2、SDCCAG8、YOD1、FGF5、C2CD2L、sRAGE、GCKR、DJC10、Apo A-IV、TCEA2、IGFBP-5和C4a与CKD共享相同的因果变异。
- BTN3A2、INHBC、MFAP4、BTN3A3、GNPTG和activin AC与CKD的共定位分析显示中等程度的共定位。
5. 蛋白质-蛋白质相互作用网络和基因本体论富集分析:
- 通过STRING数据库分析,发现HLA-DQA2、HLA-E、BTN3A2、BTN3A3和MICB等蛋白质之间存在相互作用。
- UMOD与IGFBP-5和GATM相互作用,C4a与C4b和Apo A-IV相互作用,CEP170和SDCCAG8、INHBC和INHBA(activin AC)也相互作用。
- 这些基因主要富集在T细胞介导的免疫、白细胞介导的免疫、淋巴细胞介导的免疫、适应性免疫反应和酰胺结合等生物学过程中。
- 在单细胞富集分析中,FGF5、IGFBP-5、GATM、AIF1L和UMOD mRNA在肾脏单细胞类型中表现出富集,FGF5、C4a、GATM、PFKFB2、MFAP4和UMOD mRNA在肾脏组织细胞类型中表现出富集,而GATM、PFKFB2、MFAP4、PLD3和AIF1 mRNA在免疫细胞中表现出特异性。
图 5 蛋白互作网络
慢性肾脏病(CKD)是一种全球性健康问题,影响着约10%的人口,并且与多种不良健康结果相关,如需要肾脏替代治疗、心血管事件和死亡。尽管CKD的负担在不断增加,但目前尚无有效的治愈方法,因此迫切需要新的治疗策略来延长患者的生存期。
研究通过整合血浆蛋白质组和转录组数据,识别出32种与CKD相关的潜在治疗靶点。这些靶点不仅在不同的CKD数据集、肾功能指标和临床类型中得到了验证,而且通过孟德尔随机化(MR)、基于摘要的MR(SMR)和共定位分析,确认了其中5种新蛋白质(GCKR、IGFBP-5、sRAGE、GNPTG、YOD1)为CKD治疗的优先靶点。此外,研究还发现这些蛋白质和编码基因主要富集在免疫相关途径中,并在肾脏组织或细胞中表现出富集。
这些发现不仅揭示了CKD的潜在生物学机制,还为未来的药物开发和临床治疗提供了新的方向。具体来说,FGF5、C4a、BTN3A2、GCKR、IGFBP-5、sRAGE、GNPTG和YOD1被确认为CKD治疗的优先蛋白质,这些蛋白质和编码基因在免疫相关途径中的富集表明,免疫调节可能是治疗CKD的一个重要途径。此外,通过蛋白质-蛋白质相互作用网络和基因本体论富集分析,研究进一步揭示了这些蛋白质在CKD中的潜在生物学作用。
综上所述,这项研究为CKD的治疗提供了新的视角和潜在的干预措施,有望改善CKD患者的预后。
到这里,今天的主要内容就介绍完了。从小编分享的文章中可以看出,孟德尔仍然是生信发文的热点方向。从数据上看,双样本孟德尔已经不再是主流,更多的是针对基因或蛋白的eQTL和pQTL,相信后续sQTL、ceQTL等数据也将逐渐成为热点,各位小伙伴可以专注这一热点进行切入。此外,无论是单细胞还是转录组,都是为孟德尔的分析结果做验证,这些都表明多组学联合是发文的主力。为了助力大家进行文章的设计,生新人推出了多组学联合的分析套餐,思路和分析两手抓,距离发文也就不远了,感兴趣的小伙伴不要错过呀!
参考文献
Si S, Liu H, Xu L, Zhan S. Identification of novel therapeutic targets for chronic kidney disease and kidney function by integrating multi-omics proteome with transcriptome. Genome Med. 2024 Jun 19;16(1):84. doi: 10.1186/s13073-024-01356-x. PMID: 38898508; PMCID: PMC11186236.