嘿嘿!很高兴又和大家见面啦!炎炎夏日,大伙一定要注意防晒哦!做好防晒后,不妨一起来看看馆长的今日份分享!馆长今日分享的思路是:
蛋白质组学+机器学习
思路!让我们一起来看看,来自西湖大学的大牛团队,是怎样将玩转“
组学+生信预后模型
”的!还发在了著名的自然子刊上!
来自西湖大学医学院的孙耀庭教授团队,于4月26日在Nature著名子刊《Nature Communications》上发表了题目为《An individualized protein-based prognostic model to stratify pediatric patients with papillary thyroid carcinoma》的文章,馆长认为,孙教授团队的这篇文章十分适合广大生信研究者们!文章的方法亮点满满!馆长这就给大伙分析分析~
1、大规模蛋白质组学分析+机器学习构建预后模型!
作者团队一共收集了234名甲状腺结节患者的病理样本来进行蛋白质组学分析,并收集了蛋白质组学数据。随后,再根据机器学习算法(随机森林方法)构建了预后模型!
2、肿瘤免疫微环境分析+免疫检查点分析+免疫组化验证。
CIBERSORTx被作者团队用于分析蛋白质组学数据中七种免疫细胞类型的比例。
该软件是一个特征矩阵,其中包含每种目标细胞类型的基因表达谱。随后,作者团队利用免疫荧光染色验证了免疫微环境分析的结果。这也是本文备受审稿人喜爱的重要原因!
PS:看到这,如果您也想复刻作者的高分蛋白质组学发文思路!敬请扫码联系馆长!馆长这里有大量的生信优质思路任您挑选,包您满意!
定制生信分析
云服务器租赁
加好友
备注“99”
领取试用
题目:基于个体化蛋白质的预后模型,用于对患有甲状腺状癌的儿科患者进行分层
杂志:Nature Communications
影响因子:14.7
发表时间:2024年4月
公众号回复“666”即可领取原文献,文献编号240809
研究背景
甲状腺乳头状癌(PTC)是儿童和青少年最常见的内分泌恶性肿瘤之一。与成人PTC相比,儿童PTC(PPTC)通常具有更大的肿瘤体积、更多的淋巴结转移、更高的甲状腺外侵犯率和远处转移率,以及更高的复发率,但整体死亡率较低。现有指南对PPTC个体化诊治和预后评估策略存在缺失。基因水平的研究已经揭示PPTC与成人PTC存在分子差异,但基于蛋白质组的研究尚未开展。因此,本研究拟利用蛋白质组学分析,建立一个基于机器学习的个性化预后评估模型,以期为PPTC患者的临床决策和个体化治疗提供依据。
数据来源
数据类型
|
样本数量
|
备注
|
儿童甲状腺良性结节(PB)
|
83
|
15男/68女, 平均年龄15.9±1.9岁
|
儿童甲状腺乳头状癌(PM)
|
85
|
23男/62女, 平均年龄15.6±2.4岁
|
成人甲状腺乳头状癌(AM)
|
66
|
-
|
蛋白质
|
10,426 (最终9,154)
|
采用质谱技术定量,剔除丢失值超85%的蛋白
|
重复样本
|
2个样本/组
|
进行重复实验以验证数据质量
|
总样本数
|
234
|
随机分为16个批次进行测量
|
研究思路
主要结果
1、三个临床特征是PPTC复发的危险因素
为了确定研究队列中的临床复发风险因素,作者团队为 PM 患者收集的 11 个临床特征(N = 85)中的每一个都建立了单变量 Cox 比例风险模型(CoxPH)。
接下来,作者团队根据每个显着因素将 PM 患者分为两组。进一步分析显示,在这三个特征上,两组的Kaplan-Meier生存曲线之间存在显着差异(图1A)。
此外,当作为分类变量,年龄与复发的相关性更显著。为了确定年龄变量的形式,接下来将 11 个临床特征用作多变量 CoxPH 模型的输入,森林图显示了 11 个临床特征的 HR,表明每个特征对 PPTC 复发的积极或消极影响(图1B-C)。
图1 小儿甲状腺状癌(PPTC)临床复发危险因素分析
2、小儿恶性、小儿良性和成人恶性甲状腺结节之间的蛋白质组学差异
为了进一步探索 PM 和 PB/AM 之间的差异,作者团队确定了失调的蛋白质,并生成了两个火山图(图2A-B),27个蛋白在PM与AM和PM与PB中共上/下调。
此外,热图中显示的 37 种选定蛋白质的表达,分别来自共失调蛋白和两对比较中前 5 个上调和下调的蛋白质(图2C-D)。
这些结果表明,PPTC具有独特的蛋白表达,与小儿良性结节和成人PTC不同。
图2 失调蛋白质的功能分析
3、小儿甲状腺结节免疫浸润及免疫检查点表达水平
由于多种失调的免疫相关通路和生物过程得到富集,作者团队进一步使用“计算机流式细胞术”CIBERSORTx 对儿科样本中的免疫浸润进行了分析。
作者团队归纳了七种类型的免疫细胞,它们的相对比例如图3A所示。为了验证计算机分析的免疫浸润结果,作者团队对 CD4+ 和 CD8+ T 细胞进行了免疫荧光染色,分别标记 CD3+ /CD4+ 和 CD3+ /CD8+。
PMs中富集的CD8 + T细胞和减少的CD4 + T细胞的代表性染色图像如图所示(图3B)。
图3 计算机免疫浸润分析和免疫检查点的表达水平
4、PPTC预后预测模型的建立和个体化预后分层
为了预测 PM 组患者的 PTC 复发风险,将 PM 样本随机分为训练集和独立测试集。
然后,作者团队基于两种算法(Cox比例风险模型和随机生存森林)和两种特征(临床特征和蛋白质)开发了5个模型。其中,ProtRsf模型是表现最好的模型,
因为它在训练集、交叉验证集和独立测试集上的C指数值最高,分别为99.62%、96.86%和84.95%(图4A)。
然后,对于每位患者,作者团队首先预测他/她的个体化生存曲线,并推导出曲柄风险评分。
然后,如图4B所示,作者根据复发和非复发患者的风险评分确定风险分层阈值。
图4 小儿甲状腺状癌(PPTC)预后预测
5、19 种蛋白质模型的整体和个体化性能
接下来,作者团队评估了作者团队的 ProtRsf 模型在将 PPTC 患者分层到复发风险高或低的组中的疗效。
该模型能正确预测75例85 PM患者的预后,准确率为88.24%(图5A-C)。
然而,10名患者被错误地分类:2名是假阴性,8名是假阳性。每个错误分类患者的预测预后生存曲线如图5所示。然后,作者团队仔细分析了十个错误的预测。这两个假阴性事件对应于复发但被模型归类为低风险组的患者。