专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
BioArt  ·  EMBO J | ... ·  16 小时前  
BioArt  ·  专家点评Nat Immunol | ... ·  16 小时前  
生信宝典  ·  生信入门一对一,数据操作带你飞 ·  昨天  
生信人  ·  什么?利用机器学习发1区9分! ·  3 天前  
51好读  ›  专栏  ›  生信人

什么?利用机器学习发1区9分!

生信人  · 公众号  · 生物  · 2025-03-03 07:06

正文

今天给各位介绍这一篇来自 上海海军医科大学王教授团队 发表在 Cancer Letters 上的文章。该团队将机器学习与临床肿瘤结果相结合,成功发表1区9分文章。究竟如何操作,我们又有什么能借鉴的地方,一起看下去吧!

扫码添加领资料

资料:清华大学DeepSeek从入门到精通


个性解读 |课题设计

生信热点|直播分享

一、摘要

食管鳞状细胞癌(ESCC) 是食管癌的主要亚型之一,通常预后不良。 乳酸 是癌症的重要代谢产物,对肿瘤生物学有重要影响。因此该团队构建一个 乳酸相关预后特征(LPS) ,用于预测ESCC的预后并发现潜在的治疗靶点。该团队设计了一个计算框架来识别 乳酸相关基因(LRG) ,并利用机器学习从103种组合中生成最佳LPS模型以评估LPS对患者预后、化疗、放疗和免疫治疗的预测准确性。分析还涵盖了与LPS亚型相关的基因组和蛋白质组学特征。


二、结果

1、 ESCC中乳酸相关基因表达与LPS的构建

首先通过在对ESCC和正常样本进行差异表达基因(DEG)分析后,从交集中选择了28个基因(图1B和C)。对这28个LRG的富集分析证实了它们在乳酸相关过程中的富集以及它们参与癌症途径中的中心碳代谢,表明它们与肿瘤生长和增殖的潜在关联(图1E)。并采用单变量Cox回归分析,选择了14个具有预后意义的基因进行进一步分析(图1F)。

图1.鉴定差异表达的LRG以构建LPS模型

接着该团队用机器学习从103种组合中生成最佳LPS模型。 最佳模型是RSF ,在训练数据集(C指数=0.839)和验证数据集中(C指数=0.665)都有最高的C指数(图2A)。随后,计算每个ESCC患者的LPS评分,并根据最佳临界值将其分为高LPS组和低LPS组。如图2C和D所示,在两次训练中,高LPS组的患者总体生存率(OS)明显低于低LPS组和验证队列。

图2.构建LPS模型并证明其在预测生存结果方面的有效性

2、验证LPS的预测功能

对于LPS模型, ROC曲线在TCGA数据集中表现出强大的辨别能力 ,400、800和1200天的曲线下面积分别为0.971、0.863和0.857;GSE53622中的0.851、0.810和0.847;GSE53624中的0.879、0.907和0.905(图2F)。 LPS模型的预后准确性明显高于其他临床病理变量。 单变量Cox回归确定了LPS评分、N分期和TMB评分作为显著的不利预后因素(图2G)。多变量分析证实LPS评分是一个独立的预后因素。校准曲线表明对1年、3年和5年生存率的准确预测(图3A-D)。 二元生存结果分析显示,LPS模型的准确性为0.847,敏感性为0.826,特异性为0.873,突出了其强大的性能(图3E)。

图3.LPS模型的预测性能和功能分析

3、LPS模型中对放化疗治疗的讨论

通过TCGA中临床数据的分析(图4A和B),显示低LPS组在化疗(χ2=5.56,p=0.0183)或放疗(X2=11.48,p=0.0007)方面的治疗效果明显更好。 低LPS患者不仅存活时间更长,而且对治疗反应更好。 鉴于铂和氟尿嘧啶在化疗中的主要用途以及高LPS组中观察到的不良反应,该团队使用GDSC数据集探索了靶向治疗的结果。结果表明,高LPS组对KU-60019、BI-2536、PF-4708671和帕诺比司他的反应更为敏感(图4C)。这一结果得到了基因组证据的证实(图4D)。不仅如此,高乳酸环境可能会增强肿瘤对免疫抑制剂(ICI)治疗的抵抗。使用TIDE算法,高LPS组的免疫治疗反应显著降低,TIDE评分较高,CD274表达较低(图4E和F)。因此,该团队提出 LPS可作为免疫治疗反应的预测性生物标志物。

图4.LPS模型治疗策略的探索

4、LPS模型中突变和CNV特征

该团队进一步分析了高和低LPS组的突变频率和CNVs(图5A和B)。TP53是ESCC中最常见的突变基因,在高和低LPS组中都有较高的频率。此外,在高和低LPS组中分别扩增了两个常见的肿瘤相关基因PIK3CA和NFE2L2。 这一结果表明,高LPS组有恶性肿瘤的趋势,低风险组有潜在的保护机制。


此外,对局部CNV的分析显示,高LPS组和低LPS组之间的CNV并不均匀(图5C和D)。具体而言,高LPS组在14q染色体上显示出更稳健的扩增,而低LPS组在3q染色体上表现出增强的扩增,在4染色体上表现为更明显的缺失。 高LPS组的扩增和缺失程度均高于低LPS组, 突显了与高LPS相关的复杂基因组特征(图5E)。

图5.LPS模型中基因组学机制的探索

5、LPS模型中蛋白质表达评估

在高和低LPS组中,许多蛋白质的表达都发生了显著变化(图5F)。 PPI分析显示,LYN(Src家族酪氨酸激酶)是高LPS组的关键蛋白。 LYN参与细胞增殖、分化、凋亡、迁移和代谢,并调节PI3K-Akt-mTOR信号传导和瓦博格效应(图5G)。最后,该团队在此基础上对关键蛋白参与的生物学机制进行了探讨,进一步补充和丰富了该模型的治疗潜力。


三、总结

该团队构建一个乳酸相关预后特征(LPS),用于预测ESCC的预后并发现潜在的治疗靶点。该团队设计了一个计算框架来识别乳酸相关基因(LRG),并利用 机器学习 从103种组合中 生成最佳LPS模型 以评估LPS对患者预后、化疗、放疗和免疫治疗的预测准确性。LPS模型在预测ESCC患者的生存结果方面表现出稳健可靠的准确性。LPS评分较低的患者预后较好,对化疗和放疗的反应增强。此外,在癌症类型的多个免疫疗法数据集中,低LPS评分与更好的预后相关。 总之,LPS评分可用于预测ESCC患者的预后,并有助于更精确地选择可能对治疗有反应的患者。


扫码添加领资料

资料:清华大学DeepSeek从入门到精通


个性解读 |课题设计

生信热点|直播分享


最新文章汇总 (持续更新ing)


最新热点方向

1、 去年才出的review,今年就有顶刊了——神经免疫

2、 医之侠者:中国肺癌领军人物吴一龙

3、 陈志坚成果汇总|大概率是华人下一位诺奖获得者

4、 《Nature》中肠道菌群研究的正确打开方式

5、 这文章才十来分,是被nature撤稿影响了吗?


生信人课堂

1、 多组学水平的孟德尔随机化分析套路







请到「今天看啥」查看全文