生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有! |
图1。蛋白质-疾病关联分析结果总结(A)分析流程图。基线时(2006-2010年)收集了血浆蛋白和健康相关特征的数据,而疾病数据则与英国电子健康记录链接,并详细记录了诊断时间,包括基线前后的数据。基于横断面数据和事件时间数据分别进行关联分析,以揭示不同表型的蛋白质组学特征,随后深入探讨生物学见解、预测和诊断效用以及药物靶点评估。使用BioRender(BioRender.com/o97h873)创建。(B和C)通过(B)逻辑回归和(C)Cox回归揭示的蛋白质-疾病关联,按疾病章节着色。仅绘制显著关联(B,n = 60,942;C,n = 107,158)。实心圆表示正向关联(风险比[HR] > 1),空心圆表示负向关联(HR < 1)。ENT,耳鼻喉。 (D)每个疾病章节中具有最大数量显著关联的三种主要疾病,按疾病章节着色。条形图上的蛋白质对应于相应疾病的最小p值。CLL_EXALLC,慢性淋巴细胞性白血病和小淋巴细胞性白血病,排除所有癌症(对照排除所有癌症);BLOOD_IMMUNE,血液、造血器官和免疫系统疾病;T2D,2型糖尿病;FLUIDELECTRO,其他体液、电解质和酸碱平衡紊乱;NAS,未分类;SKIN_SUBCUTANEOUS,皮肤和皮下组织疾病;RENAL-TUBULO,肾小管间质性肾脏病。(E)现有疾病和新发疾病显著关联数量的比较。 (F)现有疾病和新发疾病关联方向不一致的蛋白质-疾病对,按疾病着色。误差条代表95%置信区间(CI)。(G)性别(上)和年龄(下)亚组分析中显著关联数量的比较。红色字体表示纵向分析中的显著关联数,蓝色字体表示横断面分析中的显著关联数。(H)性别(上)和年龄(下)亚组分析中关联方向不一致的蛋白质-疾病对,按疾病着色。误差条代表95%CI。另见图S1。
图 S1。与图 1 相关的分析流程。首先,我们纳入了 53,026 名具有可用蛋白质组学和表型数据的参与者。 具体来说,我们提取了 2,920 种蛋白质、406 种常见疾病终点、660 种新发疾病终点以及 986 种特征用于主要分析。 通过逻辑回归模型(常见疾病)和比例风险回归模型(新发疾病)分别研究了血浆蛋白与疾病之间的关联。 通过线性回归模型(连续性特征)、逻辑回归模型(二元特征)和比例优势逻辑回归模型(有序分类特征)分别研究了蛋白质与特征之间的关联。 进行了针对不同性别和年龄(中年:39-59 岁;老年人:≥60 岁)的亚组分析。 其次,我们研究了蛋白质-疾病关联提供的关于疾病生物学的见解。 第三,我们研究了蛋白质对疾病鉴别的重要性。 基于三种模型(即仅蛋白质模型、仅人口统计学模型和综合模型)估计了识别出的蛋白质的预测和诊断效果,并使用 DeLong 检验比较了这三种模型的表现。 最后,我们研究了蛋白质与疾病之间潜在的因果关系。 对于具有因果关系的蛋白质,我们评估了它们作为治疗靶点的潜在价值。
人口特征和表型
图 S2。包括的表型的分布和样本量,与图 1 相关(A)根据 ICD-10 分类章评估的研究中的流行病和新发疾病的百分比。(B)每种流行病和新发疾病的平均病例数按 ICD-10 分类章分层。条形图表示病例数的最小到最大范围。(C)根据 UKB 分类章评估的研究中的健康相关特征的百分比。(D)每种特征的平均病例数按章节分层。条形图表示病例数的最小到最大范围。
蛋白质-疾病关联图谱
蛋白质性状关联图谱
图2。蛋白质-性状关联分析结果总结以及疾病和性状之间的多效性(A)按性状类别着色的蛋白质-性状关联。仅绘制显著关联(n = 554,488)。实心点表示正向关联(β > 0),而空心点表示负向关联(β < 0)。(B 和 C)在性别人群亚组分析中共享和特定显著关联的比例。(C)ALT和新发2型糖尿病之间的共享蛋白质。在ALT和2型糖尿病中p值或效应量排名前十的蛋白质被标记。ALT,丙氨酸转氨酶;T2D,2型糖尿病。(D)尿酸和痛风之间以及(E)肌酐和慢性肾病之间的共享蛋白质。显示的蛋白质是在性状和疾病中p值和效应量排名前30的蛋白质。(F)认知功能性状和新发痴呆症亚型之间的共享蛋白质。显示的蛋白质是至少与一种疾病和一种性状显著相关的蛋白质。(G)心理健康性状和新发精神障碍之间的共享蛋白质。仅显示与超过五种疾病或性状相关的蛋白质。颜色的深浅代表p值的大小。
蛋白质与表型关联中的多效性景观
与疾病相关的蛋白质的生物学功能
图3。疾病相关蛋白的生物学功能(A)按事件疾病的章节分类的Reactome通路富集分析结果,根据每个章节中排名前十的项目的频率进行颜色编码。(B)阿尔茨海默病和血管性痴呆相关的蛋白质在基因本体(GO)生物过程(BP)富集中的比较结果。所有这些结果均满足错误发现率(FDR)<0.05的阈值。显示了共享(上)和特异性(下)通路。 这些结果均满足错误发现率(FDR)<0.05的阈值。显示了共享(上)和特异性(下)通路。
具有特征性生物学特征的疾病集群
图4。40个疾病簇的特征生物学特征和选定示例(A)将660种疾病分类为40个簇的蛋白质组学分类。热图显示了基因集富集分析检测到的疾病簇中的GO BP基因集的富集情况。热图的颜色表示该簇中疾病途径评分的平均值。星号∗表示一个簇与其他簇之间不同调节的途径(FDR < 0.01)。(B-D)示例展示了簇1、39和30的疾病组成、多病共存情况、该簇中与多病共存相关的蛋白质以及(A)中该簇特有的特定途径。左上角的文字记录了该簇中包含的具体疾病。火山图显示了通过序贯回归检测到的与多病共存相关的蛋白质,以该簇中疾病的发病率作为结果。应用了Bonferroni校正(0.05/ [2,920种蛋白质∗40个簇])。圆形图显示了随访期间具有不同数量并发疾病的个体比例,反映了该簇中疾病多病共存的情况。条形图显示了该簇与其他簇之间显著不同的途径,这些途径来自(A)。另见表S6和S7。
蛋白质有助于疾病诊断和预测
图5. 蛋白质对疾病预测和诊断的贡献(A和B)基于三种模型:蛋白质、人口统计学和蛋白质加人口统计学,蛋白质在(A)预测和(B)诊断中的区分性能(以AUC量化)。误差线表示最小值到最大值范围,箱形图表示标准差,空心圆点表示平均值。任何AUC小于0.5的仅由蛋白质、仅由人口统计学或综合模型得出的疾病均未纳入图中,因为它们被认为没有信息价值。具体而言,分别有45种和24种疾病被排除在(A)预测和(B)诊断之外。AUC,曲线下面积。(C和D)按疾病章节分类的蛋白质角色堆积条形图,在(C)预测和(D)诊断疾病中,条形图上的数字代表该蛋白质的重要性在多少种疾病中排名首位。参见表S8和S9。 (A和B)基于三种模型:蛋白质、人口统计学和蛋白质加人口统计学,蛋白质在(A)预测和(B)诊断中的区分性能(以AUC量化)。
疾病的潜在致病蛋白质
图6。潜在因果和后果蛋白的总结(A) 按疾病章节着色的潜在因果蛋白堆积条形图。条形图上的数字代表与疾病的因果关联数量。(B-D) GDF15与自身免疫性疾病、(C) 蛋白质与高血压、以及(D) FURIN与心血管疾病的孟德尔随机化分析的显著结果,按疾病章节着色。(E) 可由某些疾病导致的蛋白堆积条形图,按疾病章节着色。(F-H) 疾病与(F) PLAUR、(G) EDA2R 和(H) GDF15的孟德尔随机化分析的显著结果。数据均表示为OR ± 95% CI。 Data are all represented as OR ± 95% CI.
药物靶点验证和再定位
图7。药物靶点验证、再定位和识别(A)具有可成药基因组的蛋白质富集情况。数据均以Fisher精确检验中的OR±95%CI表示。 (B)顺式MR结果与DrugBank和治疗靶点数据库中靶标-适应症对信息的比较。左图是顺式MR鉴定的显著蛋白-常见疾病关联对,右图是蛋白-偶发疾病关联对。条形上的数字代表属于每个类别的验证、再利用和未建立的配对数量。未建立的配对是指没有已确立药物的蛋白质配对。左侧框中的内容是验证的蛋白-疾病配对及其靶向该蛋白的药物的一个例子,右侧框中的内容是再利用配对的一个例子。 (C)潜在靶标的安全性、因果关系和可成药性。框中列出了安全性=1的可成药蛋白-疾病配对示例,显示了五个因果关系最强的正负例子(由比值比指示)。参见表S10。
交互式网络工具实现了对蛋白质组-表型组图谱的深入探索
研究的局限性
主要联系人
材料可用性
数据和代码可用性
所有蛋白质-疾病关联、蛋白质-特征关联、富集的生物通路、预测和诊断性能以及遗传关联的结果均已通过一个交互式门户(https://proteome-phenome-atlas.com/)发布,并且在发表日期起可供公众访问。UKB 数据在申请后可向合格的研究人员公开获取(http://www.ukbiobank.ac.uk/using-the-resource/)。本研究使用的主要数据是从 UKB(https://biobank.ndph.ox.ac.uk/)获取的,申请编号为 202239 和 19542。本研究还利用了其他公共资源,其 DOIs 列在关键资源表中。
本研究中使用的所有软件和分析方法均公开可用,详见关键资源表。本研究的分析代码已上传至GitHub,详见关键资源表。
关键资源表
实验模型和研究参与者详情
方法细节
疾病定义
健康相关特征
蛋白质组学
协变量
统计分析
量化和统计分析
蛋白质与疾病的关联
蛋白质与性状的关联
敏感性分析
亚组分析
通路富集分析
聚类分析
基因集富集分析(GSEA)
序数回归模型
预测和诊断建模
孟德尔随机化(MR)
具有可药物基因组的蛋白质富集
药物靶点验证和再定位
安全评估
额外资源
|
世界音乐 · 130年来,第一个从英国皇家音乐学院毕业的单手钢琴家 8 年前 |
|
扬子晚报 · 大寒给自己做杯蜂蜜山药汁,零厨艺也能轻松学会 | 寒潮蓝色预警来了 8 年前 |
|
腾讯数码 · 没别的啦?iPhone 8的秘密武器竟然是续航? 8 年前 |
|
美味书单 · 《平凡的世界》,只你共我 7 年前 |
|
摩托欧耶 · 白裙妹骑摩托车“霸气”奔高速的“撩人”画面 7 年前 |