神经胶质瘤是一种起源于神经胶质细胞的癌症,它是最常见的原发性恶性脑瘤。根据世界卫生组织(WHO)标准,神经胶质瘤可分为I、II、III和IV级,相关研究将II和III级胶质瘤统称为较低级别胶质瘤(lower-grade gliomas, LGG)。LGG比IV级神经胶质瘤的临床结果更好,但是近70%的LGG患者在10年内将进一步发展为恶性肿瘤,且高级别胶质瘤预后仍较差。因此LGG的预后仍然是值得关注的问题。
筛选肿瘤相关标志物来建立预后特征以预测患者的预后生存情况,是肿瘤生信分析的常规套路,那如何将旧套路玩转出新思路,让我们一起来看一篇于2020年12月发表在Frontiers in Immunology(2区,IF=5.085)上的文章,题为“An Immune-Related Signature for Predicting the Prognosis of Lower-Grade Gliomas”,这篇文章通过建立免疫相关特征来预测LGGs预后。
本研究LGG患者的表达谱数据来自TCGA和CGGA,并分别作为训练集和验证集。随后筛选肿瘤相关的差异表达基因(DEGs),与从IMMPORT数据库中获取的免疫相关基因取交集,并通过单变量Cox回归分析、LASSO回归分析及多变量Cox回归分析建立免疫相关的预后特征。随后评估免疫风险评分和临床信息如年龄、性别、WHO分级和IDH1突变频率的独立预测作用,并构建用于预测预后的个性化列线图预测模型。最后对免疫相关高风险组和低风险组的DEGs进行GO和KEGG通路富集分析。
1、数据集特征
从TCGA数据集中529个LGG样本与5个正常脑组织样本之间共检出5009个DEGs,其中
239个为免疫相关DEGs
。在剔除缺乏样本信息或存活时间少于90天的样本后,在训练集中共获得459个LGG样本,在测试集中获得362个LGG样本。在TCGA数据库中,基于459个LGG样本和5个对照样本的基因突变频率,
筛选出突变频率最高的前10个基因(图1A)。对突变频率前三名的基因(IDH1、TP53和ATRX)进行了生存曲线分析
(图1B-D),发现只有IDH1突变的LGG患者的生存率显著提高,提示
IDH1突变与预后密切相关
,可作为预测预后的潜在因素。
2、免疫相关预后特征和可预测性评估
基于239个免疫相关DEGs,研究进一步通过单变量Cox回归分析、LASSO回归分析及多变量Cox回归分析建立了16个免疫相关基因的风险评分模型。模型中各基因的β值、HR、95CI%和p值见下表
根据模型公式计算各样本的免疫相关风险评分,取训练集中风险评分的中位数(0.645),将样本分为高风险组和低风险组。获得训练集中高风险组229例和低风险组230例,以及验证集中高风险组175例和低风险组187例。根据以上训练集和验证集样本绘制的生存曲线图(图2A-B)结果显示,
低风险患者预后明显改善
。图2C显示,随着风险评分的增加,患者生存时间缩短,死亡率增加。基于训练集和验证集样本绘制的ROC曲线图(图2D-E)显示,该风险评分模型具有较好的预测患者预后的能力,
AUC值分别为0.941和0.712
。以上结果说明
筛选的16个免疫相关预后特征基因对LGGs患者预后具有较好的可预测性
。
3、免疫相关预后特征的独立预测作用
研究进一步采用单因素和多因素Cox回归分析来确定各种临床因素的独立预测作用。图3A是单因素Cox回归分析,图3B是为多因素Cox回归分析。结果显示,
年龄、WHO分级、IDH1突变状态以及免疫相关风险评分是总生存期相关的独立预后因素
。在这些独立因素中,风险评分是最关键的,起着至关重要的作用。此外,
年龄、WHO分级和风险评分与预后风险成正相关,而IDH1突变频率越高,预后风险越低。
4、个性化列线图的建立与验证
研究进一步基于4个独立预测因子构建了列线图预测模型,如图3C所示,每个独立预测因子的评分区间可从变量轴中获得。通过计算样本中4个独立预测因子的得分总和(区间为0-160),来预测LGG患者1年、3年和5年的生存预后情况。
随后计算C指数对列线图的预测模型进行了内部验证和外部验证,预测结果达到了合理的精度。内部验证C指数为0.878,外部验证C指数为0.680,预测能力一致。
研究还通过校准曲线来确定列线图预测模型的预测能力,图4展示了训练队列(A-C)和验证队列(D-F)预测1年、3年和5年生存率的校准曲线,可以看出各校准曲线均有良好的拟合度。
5、GO和KEGG通路分析
随后在TCGA样本中免疫相关高低风险组之间筛选到1263个DEGs,并进行GO和KEGG富集分析。图5中的气泡图显示了GO-BP、CC和MF校正后p值排名前10的结果。
筛选出与肿瘤微环境相关的功能,如细胞外基质(ECM)功能、免疫应答和细胞因子分泌。KEGG分析表明(图6),这些DEGs参与了ECM受体相互作用、肿瘤蛋白聚糖、PI3K-Akt信号通路、细胞周期、细胞因子受体相互作用等通路,与恶性肿瘤的生物学功能相关。
本研究建立的预后特征可以为LGG患者提供预测的生物标志物或治疗靶点。然而,值得注意的是,
该标记是基于16个免疫相关基因建立的,并没有被证明是最好的预后标记
。此外,
在CGGA中进行基因突变频率的验证时,使用的是IDH1/2突变,可能导致验证结果的不准确性。
本研究构建了一个个性化列线图的预测模型,并通过计算内部验证和外部验证的C指数和绘制校准曲线,对该模型的预测效能进行了验证。此外,研究还引入了IDH1突变频率与预后的关系,证实了IDH1突变频率对LGG预后风险的独立预测作用。研究的创新点值得学习和借鉴。
原文链接
Zhang H,Li X, Li Y, Chen B, Zong Z, Shen L. An Immune-Related Signature for Predictingthe Prognosis of Lower-Grade Gliomas. Front Immunol. 2020 Dec 8;11:603341. doi:10.3389/fimmu.2020.603341. PMID: 33363544; PMCID: PMC7753319. (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7753319/)