专栏名称: 生信图书馆
深入解读最新生信文献,分享研究思路和方法,提供专业生信分析服务,帮助您把握生物信息学的最新动态
目录
相关文章推荐
传媒招聘那些事儿  ·  SMG上海广播电视台!新媒体运营中心内容运营编辑 ·  昨天  
传媒招聘那些事儿  ·  小红书:商业化 - PM广告媒介&项目管理 ·  昨天  
传媒招聘那些事儿  ·  淘天集团:1688-AI产品运营 ·  2 天前  
传媒招聘那些事儿  ·  字节跳动:高级公关经理-业务BP方向 ·  2 天前  
51HR派  ·  给外卖员交社保,困境不止一个 ·  2 天前  
51好读  ›  专栏  ›  生信图书馆

单细胞分析已经进化到这个程度了吗?上海交通大学医学院团队的多机器学习模型,适合临床人的一区攻略!

生信图书馆  · 公众号  ·  · 2024-07-08 19:06

正文

各位小伙伴们大家好,暑期来临,天气炎热的同时,希望大家学习的热情也能持续高涨!江江包依旧饱含热情,与小伙伴们一起学习独特且前沿的研究思路!今天江江包与大家一起来学习一篇聚焦 单细胞分析和多种机器学习 的文章,研究内容非常标准,适合医学方向的小伙伴学习复现!

单细胞RNA-seq是近些年备受关注的技术,可以对肿瘤内各种细胞群和表型状态进行更充分的鉴定,并且能提供对肿瘤异质性和进化的多角度理解。今天江江包来和大家一起学习一篇 上海交通大学医学院 的研究论文,文章 聚焦于应用单细胞RNA-seq分析和多种机器学习的预后模型在肿瘤免疫和预后中的作用 ,快来跟江江包一起看看吧:

1、单细胞RNA-seq分析 :通过单细胞RNA-seq技术,对ccRCC及良性肾脏组织进行数据收集和分析,经过质量控制、基因筛选和降维处理,最终进行细胞聚类和注释,揭示了肿瘤细胞的异质性。

2、多种机器学习构建和测试预后模型 :利用101种机器学习算法,结合六个独立的ccRCC RNA数据集,构建并验证MECRGS预后模型,通过降维、批次效应校正和差异基因表达分析,系统探讨其临床和免疫学特征。

综合来看,该研究发现了一种独特的 ccRCC 肿瘤细胞亚型,确定了基因表达特征,并揭示了这些细胞与其他细胞类型之间的潜在串扰模式,以及免疫抑制性微环境的建立过程。~ ps:生物医学领域的研究需要广度也需要深度,不仅需要广泛学习研究思路,还要做出研究的差异性,扫码联系江江包,迅速积累研究思路和方法!

定制生信分析

云服务器租赁

加好友 备注“66” 领取试用

题目 透明细胞肾细胞癌恶性上皮细胞相关基因的综合研究:预后特征的开发和肿瘤微环境相互作用的探索

杂志 :Journal of Translational Medicine

影响因子 :IF=6.1

发表时间 :2024年7月

研究背景

肾细胞癌(RCC)是一种常见的肾脏恶性肿瘤,起源于肾上皮细胞。近年来,免疫检查点抑制剂作为各种癌症的治疗方法显示出广阔的潜力,然而只有一部分患者获得了显著且持久的优势,因此对新型生物标志物或特征的需求越来越大。单细胞RNA测序(scRNA-seq)技术的进步迅速增强了肿瘤内各种细胞群和表型状态的鉴定,并提供了对肿瘤异质性和进化的全面理解。本研究通过分析scRNA-seq数据和大量RNA测序数据,基于101种机器学习算法开发了恶性上皮细胞相关基因特征(MECRGS),系统探讨了MECRGS在预测ccRCC患者预后、免疫治疗反应及其与免疫和临床特征的关系方面的表现。

研究思路

研究收集了ccRCC和良性肾脏组织的单细胞RNA-seq数据,经过质量控制和降维处理后进行细胞聚类和注释。然后利用101种机器学习算法构建和验证预后模型MECRGS,通过六个独立的ccRCC RNA数据集进行预处理、批次效应校正和差异基因表达分析,系统探讨其临床和免疫学特征,揭示了肿瘤细胞的异质性及其在免疫抑制微环境中的作用。

主要结果

1.使用scRNA-seq数据鉴定恶性上皮细胞相关基因

为了探索ccRCC恶性上皮细胞与正常肾脏相比高表达的基因, 对GSE159115获得的8个RCC肿瘤和6个良性人肾组织进行了scRNA-seq分析 。在质量控制之后,利用harmony去除了批次效应。随后进行了 t-SNE降维,将 25 个亚群分配给 11 种不同的细胞类型 (图1A)。热图展示了每个细胞群的顶级标记基因。不同细胞类型的百分比在肿瘤和正常组织之间差异很大, 上皮细胞占总细胞群的很大比例 (图1B,C)。利用InferCNV,将恶性细胞与正常细胞区分开来,将 所有来源于肿瘤的上皮细胞归类为恶性细胞 ,其表现出高水平的拷贝数变异(图1D)。在进行鉴别分析以比较ccRCC中的恶性和非恶性上皮细胞后,利用TCGA KIRC批量RNA-seq数据进行验证, 将219个基因指定为恶性上皮细胞相关基因(MECRG) (图1E,F)。GO分析表明,这些MECRGs在与氧水平降低、缺氧反应和免疫系统过程负调节相关的通路中显着富集(图1G)。此外,KEGG通路分析显示,与HlF-1信号通路、抗原加工和呈递以及糖酵解/糖异生相关的通路显著富集(图1 H)。

图1 鉴定癌细胞和正常上皮细胞之间的DEGs

2.MECRGS的集成开发和评估

对219个MERG进行了单变量Cox分析,并确定了71个预后相关基因进行了基于机器学习的整合方法,以确定具有最高准确性和稳定性的最优模型。 在101个机器学习模型中,排名前 5 位的模型表现出较高的平均一致性指数(C-index)值 (图2A)。 最终选择了“CoxBoost + Ridge”作为最终选择 ,因为它具有卓越的性能和简单性。最后,我们基于CoxBoost和Ridge组合模型开发了一种恶性上皮细胞相关特征(MECRGS),该特征在多个数据集中表现出很高的准确性。

根据survminer包计算出的最优临界分数, 将ccRCC患者分为MECRGS高分组和低MECRGS分组 (图2B)。PCA算法结果表明,使用MECRGS模型基因可以对TCGA-KIRC队列中的患者进行准确分类,在所有数据集中, MECRGS 评分高的患者总生存期明显缩短 (图 2C-I)。随后,我们进行了时间依赖性ROC分析,以评估MECRGS在生存方面的鉴别能力(图2J)。此外,与高MECRGS组相比, 低MECRGS组患者的无进展间期(PFI)和疾病特异性生存期(DSS)明显更长 (图3A,C)。AUC 值支持 MECRGS 模型在预测生存结果方面的准确性(图 3B,D)。总体而言,这些结果进一步凸显了MECRGS在多个独立队列中的卓越表现。

图2 开发和验证基于机器学习的预后特征 MECRGS

3.MECRGS与临床特征的关系

研究旨在 评估MECRGS与各种临床性状之间的相关性 。多因素Cox分析表明,在调整临床因素后, MECRGS是训练队列中OS、DSS和PFI的独立预后因素 (图3E,F)。这一发现在其他数据集中也得到了验证,表明MECRGS作为ccRCC预后标志物的稳健性(图3G)。为了进一步评估MECRGS与其他临床病理特征相比的优越性,在训练和验证队列中进行了全面比较。结果表明, MECRGS和临床阶段的预测能力比每个个体特征都要好 (图3H-J)。此外,将MECRGS与临床分期相结合时,综合模型显示出 比单独使用MECRGS或临床分期更高的C指数 (图3K-M)。因此,MECRGS与临床阶段的结合可能会进一步提高预测模型的性能。

图3 MECRGS的生存分析和预测性能评估

4. MECRGS 对 ccRCC 发炎但免疫抑制的 TME的影响

采用IOBR R软件包 全面分析TCGA-KIRC队列中高MECRGS亚组和低MECRGS亚组中免疫细胞的浸润情况 。结果显示, 免疫细胞浸润水平在高MECRGS患者中显着升高,表明免疫激活状态(图4A,B)。还发现在高MECRGS组中,通过ESTIMATE包获得的免疫评分更高。相比之下,低MECRGS组显示出内皮细胞、平滑肌细胞和其他基质细胞的高富集。尽管如此,在高MECRGS组和低MECRGS组之间观察到的基质评分没有显着差异 (图4C)。此外,高MECRGS组不仅显示出与趋化因子受体(CCR)、T细胞共刺激和炎症促进相关的免疫细胞和免疫特征水平升高(图4D),也表现出调节性T细胞(Tregs)、癌症相关细胞外基质(C-ECM)和肿瘤浸润性调节性T细胞(TITR)特征的显着激活(图4E)。这 表示免疫状态疲惫和抑制 。然后比较了免疫调节因子的表达谱,发现高MECRGS组富含耗尽的CD8 + T细胞标志物(图4F)。它们还起到了免疫检查点的作用。这一发现表明,与低MECRGS组相比, 高MECRGS组表现出免疫检查点分子的表达升高 ,可能是为了逃避免疫激活后的免疫破坏。

图4 两个亚组之间免疫浸润和免疫调节的改变

5. 在单细胞水平上研究MECRGS的中心基因

为了 在单细胞转录组水平上探索MECRGS在肿瘤微环境(TME)中的功能 ,我们对不同细胞类型中枢纽基因的表达谱进行了分析。使用 FindClusters 函数对肿瘤细胞进行聚类, 鉴定了一种肿瘤亚型 PLOD2 + SAA1 + ccRCC 细胞 ,其显示出更高的 MECRGS 评分、CNV 评分和干性评分(图 5A-D)。此外,我们在另外四个scRNA测序数据集中观察到了这种特定肿瘤细胞簇的存在和Renji TMA队列(图5E),其特征是 PLOD2、SAA1、C1R 和 C1S 的表达水平升高。重要的是, 这些基因的表达随着 ccRCC 患者 TNM 分期的进展而增加 ,表明它们可以作为 ccRCC 的有价值的预后指标(图 6F-M)。这些发现表明 基因的上调可能与ccRCC的进展和侵袭性有关 。此外,对Hallmark通路的GSVE分析表明,这种肿瘤细胞亚型在与上皮-间充质转化、糖酵解、活性氧通路、干扰素α反应和补体相关的通路中表现出更高的活性(图6N)。

图5 ccRCC中肿瘤上皮细胞的瘤间异质性

6. PLOD2 + SAA1 + 肿瘤细胞的通讯与免疫治疗

研究了 PLOD2 + SAA1 + 肿瘤细胞与 TME 中其他类型细胞的相互作用 。根据我们的研究结果,我们 观察到 PLOD2 + SAA1 + 肿瘤细胞能够与 TME 细胞进行通信 ,并在 SPP1、MIF、PTN 和 MK 等信号通路中充当强大的发送者和影响者(图 6A-F 和 7A)。LIGHT 信号通路涉及淋巴毒素相关诱导配体的TNF家族成员与其受体之间的相互作用。该通路







请到「今天看啥」查看全文


推荐文章
传媒招聘那些事儿  ·  小红书:商业化 - PM广告媒介&项目管理
昨天
传媒招聘那些事儿  ·  淘天集团:1688-AI产品运营
2 天前
传媒招聘那些事儿  ·  字节跳动:高级公关经理-业务BP方向
2 天前
环球科学  ·  五位世界冠军联手,再负AlphaGo
7 年前
品牌几何  ·  北京 | 【完美时空】营销策划
7 年前
正反读书  ·  最最遥远的路:柴静写给白岩松
7 年前