|
各位小伙伴们大家好,暑期来临,天气炎热的同时,希望大家学习的热情也能持续高涨!江江包依旧饱含热情,与小伙伴们一起学习独特且前沿的研究思路!今天江江包与大家一起来学习一篇聚焦
单细胞分析和多种机器学习
的文章,研究内容非常标准,适合医学方向的小伙伴学习复现!
单细胞RNA-seq是近些年备受关注的技术,可以对肿瘤内各种细胞群和表型状态进行更充分的鉴定,并且能提供对肿瘤异质性和进化的多角度理解。今天江江包来和大家一起学习一篇
上海交通大学医学院
的研究论文,文章
聚焦于应用单细胞RNA-seq分析和多种机器学习的预后模型在肿瘤免疫和预后中的作用
,快来跟江江包一起看看吧:
1、单细胞RNA-seq分析
:通过单细胞RNA-seq技术,对ccRCC及良性肾脏组织进行数据收集和分析,经过质量控制、基因筛选和降维处理,最终进行细胞聚类和注释,揭示了肿瘤细胞的异质性。
2、多种机器学习构建和测试预后模型
:利用101种机器学习算法,结合六个独立的ccRCC RNA数据集,构建并验证MECRGS预后模型,通过降维、批次效应校正和差异基因表达分析,系统探讨其临床和免疫学特征。
综合来看,该研究发现了一种独特的 ccRCC 肿瘤细胞亚型,确定了基因表达特征,并揭示了这些细胞与其他细胞类型之间的潜在串扰模式,以及免疫抑制性微环境的建立过程。~
ps:生物医学领域的研究需要广度也需要深度,不仅需要广泛学习研究思路,还要做出研究的差异性,扫码联系江江包,迅速积累研究思路和方法!
|
定制生信分析
云服务器租赁
加好友
备注“66”
领取试用
|
|
题目
:
透明细胞肾细胞癌恶性上皮细胞相关基因的综合研究:预后特征的开发和肿瘤微环境相互作用的探索
杂志
:Journal of Translational Medicine
影响因子
:IF=6.1
发表时间
:2024年7月
|
研究背景
肾细胞癌(RCC)是一种常见的肾脏恶性肿瘤,起源于肾上皮细胞。近年来,免疫检查点抑制剂作为各种癌症的治疗方法显示出广阔的潜力,然而只有一部分患者获得了显著且持久的优势,因此对新型生物标志物或特征的需求越来越大。单细胞RNA测序(scRNA-seq)技术的进步迅速增强了肿瘤内各种细胞群和表型状态的鉴定,并提供了对肿瘤异质性和进化的全面理解。本研究通过分析scRNA-seq数据和大量RNA测序数据,基于101种机器学习算法开发了恶性上皮细胞相关基因特征(MECRGS),系统探讨了MECRGS在预测ccRCC患者预后、免疫治疗反应及其与免疫和临床特征的关系方面的表现。
研究思路
研究收集了ccRCC和良性肾脏组织的单细胞RNA-seq数据,经过质量控制和降维处理后进行细胞聚类和注释。然后利用101种机器学习算法构建和验证预后模型MECRGS,通过六个独立的ccRCC RNA数据集进行预处理、批次效应校正和差异基因表达分析,系统探讨其临床和免疫学特征,揭示了肿瘤细胞的异质性及其在免疫抑制微环境中的作用。
|
主要结果
1.使用scRNA-seq数据鉴定恶性上皮细胞相关基因
为了探索ccRCC恶性上皮细胞与正常肾脏相比高表达的基因,
对GSE159115获得的8个RCC肿瘤和6个良性人肾组织进行了scRNA-seq分析
。在质量控制之后,利用harmony去除了批次效应。随后进行了
t-SNE降维,将 25 个亚群分配给 11 种不同的细胞类型
(图1A)。热图展示了每个细胞群的顶级标记基因。不同细胞类型的百分比在肿瘤和正常组织之间差异很大,
上皮细胞占总细胞群的很大比例
(图1B,C)。利用InferCNV,将恶性细胞与正常细胞区分开来,将
所有来源于肿瘤的上皮细胞归类为恶性细胞
,其表现出高水平的拷贝数变异(图1D)。在进行鉴别分析以比较ccRCC中的恶性和非恶性上皮细胞后,利用TCGA KIRC批量RNA-seq数据进行验证,
将219个基因指定为恶性上皮细胞相关基因(MECRG)
(图1E,F)。GO分析表明,这些MECRGs在与氧水平降低、缺氧反应和免疫系统过程负调节相关的通路中显着富集(图1G)。此外,KEGG通路分析显示,与HlF-1信号通路、抗原加工和呈递以及糖酵解/糖异生相关的通路显著富集(图1 H)。
|
图1
鉴定癌细胞和正常上皮细胞之间的DEGs
|
2.MECRGS的集成开发和评估
对219个MERG进行了单变量Cox分析,并确定了71个预后相关基因进行了基于机器学习的整合方法,以确定具有最高准确性和稳定性的最优模型。
在101个机器学习模型中,排名前 5 位的模型表现出较高的平均一致性指数(C-index)值
(图2A)。
最终选择了“CoxBoost + Ridge”作为最终选择
,因为它具有卓越的性能和简单性。最后,我们基于CoxBoost和Ridge组合模型开发了一种恶性上皮细胞相关特征(MECRGS),该特征在多个数据集中表现出很高的准确性。
根据survminer包计算出的最优临界分数,
将ccRCC患者分为MECRGS高分组和低MECRGS分组
(图2B)。PCA算法结果表明,使用MECRGS模型基因可以对TCGA-KIRC队列中的患者进行准确分类,在所有数据集中,
MECRGS 评分高的患者总生存期明显缩短
(图 2C-I)。随后,我们进行了时间依赖性ROC分析,以评估MECRGS在生存方面的鉴别能力(图2J)。此外,与高MECRGS组相比,
低MECRGS组患者的无进展间期(PFI)和疾病特异性生存期(DSS)明显更长
(图3A,C)。AUC 值支持 MECRGS 模型在预测生存结果方面的准确性(图 3B,D)。总体而言,这些结果进一步凸显了MECRGS在多个独立队列中的卓越表现。
|
图2 开发和验证基于机器学习的预后特征 MECRGS
|
3.MECRGS与临床特征的关系
研究旨在
评估MECRGS与各种临床性状之间的相关性
。多因素Cox分析表明,在调整临床因素后,
MECRGS是训练队列中OS、DSS和PFI的独立预后因素
(图3E,F)。这一发现在其他数据集中也得到了验证,表明MECRGS作为ccRCC预后标志物的稳健性(图3G)。为了进一步评估MECRGS与其他临床病理特征相比的优越性,在训练和验证队列中进行了全面比较。结果表明,
MECRGS和临床阶段的预测能力比每个个体特征都要好
(图3H-J)。此外,将MECRGS与临床分期相结合时,综合模型显示出
比单独使用MECRGS或临床分期更高的C指数
(图3K-M)。因此,MECRGS与临床阶段的结合可能会进一步提高预测模型的性能。
|
图3 MECRGS的生存分析和预测性能评估
|
4.
MECRGS 对 ccRCC 发炎但免疫抑制的 TME的影响
采用IOBR R软件包
全面分析TCGA-KIRC队列中高MECRGS亚组和低MECRGS亚组中免疫细胞的浸润情况
。结果显示,
免疫细胞浸润水平在高MECRGS患者中显着升高,表明免疫激活状态(图4A,B)。还发现在高MECRGS组中,通过ESTIMATE包获得的免疫评分更高。相比之下,低MECRGS组显示出内皮细胞、平滑肌细胞和其他基质细胞的高富集。尽管如此,在高MECRGS组和低MECRGS组之间观察到的基质评分没有显着差异
(图4C)。此外,高MECRGS组不仅显示出与趋化因子受体(CCR)、T细胞共刺激和炎症促进相关的免疫细胞和免疫特征水平升高(图4D),也表现出调节性T细胞(Tregs)、癌症相关细胞外基质(C-ECM)和肿瘤浸润性调节性T细胞(TITR)特征的显着激活(图4E)。这
表示免疫状态疲惫和抑制
。然后比较了免疫调节因子的表达谱,发现高MECRGS组富含耗尽的CD8 + T细胞标志物(图4F)。它们还起到了免疫检查点的作用。这一发现表明,与低MECRGS组相比,
高MECRGS组表现出免疫检查点分子的表达升高
,可能是为了逃避免疫激活后的免疫破坏。
|
图4 两个亚组之间免疫浸润和免疫调节的改变
|
5.
在单细胞水平上研究MECRGS的中心基因
为了
在单细胞转录组水平上探索MECRGS在肿瘤微环境(TME)中的功能
,我们对不同细胞类型中枢纽基因的表达谱进行了分析。使用 FindClusters 函数对肿瘤细胞进行聚类,
鉴定了一种肿瘤亚型 PLOD2 + SAA1 + ccRCC 细胞
,其显示出更高的 MECRGS 评分、CNV 评分和干性评分(图 5A-D)。此外,我们在另外四个scRNA测序数据集中观察到了这种特定肿瘤细胞簇的存在和Renji TMA队列(图5E),其特征是 PLOD2、SAA1、C1R 和 C1S 的表达水平升高。重要的是,
这些基因的表达随着 ccRCC 患者 TNM 分期的进展而增加
,表明它们可以作为 ccRCC 的有价值的预后指标(图 6F-M)。这些发现表明
基因的上调可能与ccRCC的进展和侵袭性有关
。此外,对Hallmark通路的GSVE分析表明,这种肿瘤细胞亚型在与上皮-间充质转化、糖酵解、活性氧通路、干扰素α反应和补体相关的通路中表现出更高的活性(图6N)。
|
图5 ccRCC中肿瘤上皮细胞的瘤间异质性
|
6.
PLOD2 + SAA1 + 肿瘤细胞的通讯与免疫治疗
研究了 PLOD2 + SAA1 + 肿瘤细胞与 TME 中其他类型细胞的相互作用
。根据我们的研究结果,我们
观察到 PLOD2 + SAA1 + 肿瘤细胞能够与 TME 细胞进行通信
,并在 SPP1、MIF、PTN 和 MK 等信号通路中充当强大的发送者和影响者(图 6A-F 和 7A)。LIGHT 信号通路涉及淋巴毒素相关诱导配体的TNF家族成员与其受体之间的相互作用。该通路
|