专栏名称: 生信图书馆
深入解读最新生信文献,分享研究思路和方法,提供专业生信分析服务,帮助您把握生物信息学的最新动态
目录
相关文章推荐
91运营网  ·  91运营网vip会员早鸟票抢座ing!! ·  18 小时前  
运营研究社  ·  《运营总监实战手册3.0》包邮送,真香 ·  22 小时前  
运营研究社  ·  第一批转战支付宝的财经博主,已有人月入百万 ·  22 小时前  
运营研究社  ·  2元管饱的县城地头蛇,集体打退网红店 ·  4 天前  
51好读  ›  专栏  ›  生信图书馆

IF=14.7!顶级“水刊”又见预后模型!西湖大学团队“蛋白组学+机器学习+免疫微环境”豪取顶刊!可复现性佳!一学一个不吱声!

生信图书馆  · 公众号  ·  · 2024-08-09 19:00

正文

嘿嘿!很高兴又和大家见面啦!炎炎夏日,大伙一定要注意防晒哦!做好防晒后,不妨一起来看看馆长的今日份分享!馆长今日分享的思路是: 蛋白质组学+机器学习 思路!让我们一起来看看,来自西湖大学的大牛团队,是怎样将玩转“ 组学+生信预后模型 ”的!还发在了著名的自然子刊上!

来自西湖大学医学院的孙耀庭教授团队,于4月26日在Nature著名子刊《Nature Communications》上发表了题目为《An individualized protein-based prognostic model to stratify pediatric patients with papillary thyroid carcinoma》的文章,馆长认为,孙教授团队的这篇文章十分适合广大生信研究者们!文章的方法亮点满满!馆长这就给大伙分析分析~

1、大规模蛋白质组学分析+机器学习构建预后模型! 作者团队一共收集了234名甲状腺结节患者的病理样本来进行蛋白质组学分析,并收集了蛋白质组学数据。随后,再根据机器学习算法(随机森林方法)构建了预后模型!

2、肿瘤免疫微环境分析+免疫检查点分析+免疫组化验证。 CIBERSORTx被作者团队用于分析蛋白质组学数据中七种免疫细胞类型的比例。 该软件是一个特征矩阵,其中包含每种目标细胞类型的基因表达谱。随后,作者团队利用免疫荧光染色验证了免疫微环境分析的结果。这也是本文备受审稿人喜爱的重要原因! PS:看到这,如果您也想复刻作者的高分蛋白质组学发文思路!敬请扫码联系馆长!馆长这里有大量的生信优质思路任您挑选,包您满意!

定制生信分析

云服务器租赁

加好友 备注“99” 领取试用


题目:基于个体化蛋白质的预后模型,用于对患有甲状腺状癌的儿科患者进行分层

杂志:Nature Communications

影响因子:14.7

发表时间:2024年4月

公众号回复“666”即可领取原文献,文献编号240809

研究背景

甲状腺乳头状癌(PTC)是儿童和青少年最常见的内分泌恶性肿瘤之一。与成人PTC相比,儿童PTC(PPTC)通常具有更大的肿瘤体积、更多的淋巴结转移、更高的甲状腺外侵犯率和远处转移率,以及更高的复发率,但整体死亡率较低。现有指南对PPTC个体化诊治和预后评估策略存在缺失。基因水平的研究已经揭示PPTC与成人PTC存在分子差异,但基于蛋白质组的研究尚未开展。因此,本研究拟利用蛋白质组学分析,建立一个基于机器学习的个性化预后评估模型,以期为PPTC患者的临床决策和个体化治疗提供依据。

数据来源

数据类型

样本数量

备注

儿童甲状腺良性结节(PB)

83

15男/68女, 平均年龄15.9±1.9岁

儿童甲状腺乳头状癌(PM)

85

23男/62女, 平均年龄15.6±2.4岁

成人甲状腺乳头状癌(AM)

66

-

蛋白质

10,426 (最终9,154)

采用质谱技术定量,剔除丢失值超85%的蛋白

重复样本

2个样本/组

进行重复实验以验证数据质量

总样本数

234

随机分为16个批次进行测量

研究思路

主要结果

1、三个临床特征是PPTC复发的危险因素

为了确定研究队列中的临床复发风险因素,作者团队为 PM 患者收集的 11 个临床特征(N = 85)中的每一个都建立了单变量 Cox 比例风险模型(CoxPH)。 接下来,作者团队根据每个显着因素将 PM 患者分为两组。进一步分析显示,在这三个特征上,两组的Kaplan-Meier生存曲线之间存在显着差异(图1A)。 此外,当作为分类变量,年龄与复发的相关性更显著。为了确定年龄变量的形式,接下来将 11 个临床特征用作多变量 CoxPH 模型的输入,森林图显示了 11 个临床特征的 HR,表明每个特征对 PPTC 复发的积极或消极影响(图1B-C)。

图1 小儿甲状腺状癌(PPTC)临床复发危险因素分析

2、小儿恶性、小儿良性和成人恶性甲状腺结节之间的蛋白质组学差异

为了进一步探索 PM 和 PB/AM 之间的差异,作者团队确定了失调的蛋白质,并生成了两个火山图(图2A-B),27个蛋白在PM与AM和PM与PB中共上/下调。 此外,热图中显示的 37 种选定蛋白质的表达,分别来自共失调蛋白和两对比较中前 5 个上调和下调的蛋白质(图2C-D)。 这些结果表明,PPTC具有独特的蛋白表达,与小儿良性结节和成人PTC不同。

图2 失调蛋白质的功能分析

3、小儿甲状腺结节免疫浸润及免疫检查点表达水平

由于多种失调的免疫相关通路和生物过程得到富集,作者团队进一步使用“计算机流式细胞术”CIBERSORTx 对儿科样本中的免疫浸润进行了分析。 作者团队归纳了七种类型的免疫细胞,它们的相对比例如图3A所示。为了验证计算机分析的免疫浸润结果,作者团队对 CD4+ 和 CD8+ T 细胞进行了免疫荧光染色,分别标记 CD3+ /CD4+ 和 CD3+ /CD8+。 PMs中富集的CD8 + T细胞和减少的CD4 + T细胞的代表性染色图像如图所示(图3B)。

图3 计算机免疫浸润分析和免疫检查点的表达水平

4、PPTC预后预测模型的建立和个体化预后分层

为了预测 PM 组患者的 PTC 复发风险,将 PM 样本随机分为训练集和独立测试集。 然后,作者团队基于两种算法(Cox比例风险模型和随机生存森林)和两种特征(临床特征和蛋白质)开发了5个模型。其中,ProtRsf模型是表现最好的模型, 因为它在训练集、交叉验证集和独立测试集上的C指数值最高,分别为99.62%、96.86%和84.95%(图4A)。 然后,对于每位患者,作者团队首先预测他/她的个体化生存曲线,并推导出曲柄风险评分。 然后,如图4B所示,作者根据复发和非复发患者的风险评分确定风险分层阈值。

图4 小儿甲状腺状癌(PPTC)预后预测

5、19 种蛋白质模型的整体和个体化性能

接下来,作者团队评估了作者团队的 ProtRsf 模型在将 PPTC 患者分层到复发风险高或低的组中的疗效。 该模型能正确预测75例85 PM患者的预后,准确率为88.24%(图5A-C)。 然而,10名患者被错误地分类:2名是假阴性,8名是假阳性。每个错误分类患者的预测预后生存曲线如图5所示。然后,作者团队仔细分析了十个错误的预测。这两个假阴性事件对应于复发但被模型归类为低风险组的患者。







请到「今天看啥」查看全文