专栏名称: 生信图书馆
深入解读最新生信文献,分享研究思路和方法,提供专业生信分析服务,帮助您把握生物信息学的最新动态
目录
相关文章推荐
GiantPandaCV  ·  《超大规模操作手册:在 GPU 集群上训练 ... ·  2 天前  
重庆之声  ·  最新丨每月1864元!2025年重庆失业保险 ... ·  2 天前  
第1眼新闻  ·  轨道15号线首列车来了,长这样→ ·  3 天前  
51好读  ›  专栏  ›  生信图书馆

​谁敢横刀立马,唯我公开数据集!内质网应激+单细胞+机器学习,干湿结合完美思路,发文如德芙般纵享丝滑!

生信图书馆  · 公众号  ·  · 2024-08-04 19:00

正文

馆长听到了小伙伴们的呼唤快快的出现在你滴眼前!最近闲来无事想给小伙伴们找点新鲜玩意分享一下嘞,逛着逛着发现了一篇刚刚发表于Journal of Translational Medicine没几日的文章,相比于该期刊其它文献接受过程较缓慢,因此肯定本文在各方面应该是比较完美的状态啦!馆长细细看了一下,干湿结合,思路完整,迫不及待地要跟大家分享,且看馆长带你慢慢学习!

本文整合 GEO数据集 (GSE25097、GSE62232、GSE65372)来识别与HCC相关的差异表达基因(ERSRG),应用 随机森林(RF)和支持向量机(SVM) 机器学习技术筛选与 内质网应激 相关的ERSRG,并构建人工神经网络( ANN) 诊断预测模型。还使用 ESTIMATE算法 分析ERSRG与免疫微环境之间的相关性,利用 药物特征数据库(DSigDB) 对ERSRG的潜在治疗药物进行研究。通过 单细胞测序 评估了ERSRGs中心基因PPP1R16A的免疫学景观,最后进行细胞学实验验证了其生物学功能,思路清晰完整,简直是个发文模板! PS:你是否担心纯生信不好发文呢?那不如尝试一下干湿结合的思路,数据分析固然重要,验证实验更是锦上添花!想要复现完整的干湿结合思路就快点来找馆长吧!提供各种专属服务包您安心!

定制生信分析

云服务器租赁

加好友 备注“99” 领取试用


题目:内质网应激通过调节免疫促进肝癌:一项基于人工神经网络和单细胞测序的研究
杂志:Journal of Translational Medicine
影响因子:IF=6.1
发表时间:2024年7月
公众号回复“666”即可领取原文献,文献编号240804
研究背景
肝细胞癌(HCC)具有 发病机制复杂、治疗方法有限、预后差 等特点。内质网应激(ERS)在HCC的发生发展中发挥着重要作用,因此需要进一步研究HCC和ERS的分子机制,以实现早期诊断和有希望的治疗目标。
数据来源
数据集
数据库
数据类型
详细信息
GSE25097
GEO
Rna-seq数据
249个正常组织和268个肿瘤组织
GSE62232
GEO
Rna-seq数据
10个正常组织和81个肿瘤组织
GSE65372
GEO
Rna-seq数据
15个正常组织和39个肿瘤组织
研究思路
首先整合 GEO数据集 (GSE25097、GSE62232和GSE65372)来识别与HCC相关的差异表达基因(ERSRG),应用 随机森林(RF)和支持向量机(SVM) 机器学习技术筛选与内质网应激相关的ERSRG,并构建 人工神经网络(ANN) 诊断预测模型。随后使用 ESTIMATE算法 分析ERSRGs与免疫微环境之间的相关性,利用 药物特征数据库(DSigDB) 探索了ERSRG的潜在治疗药物。最后通过 单细胞测序和细胞通讯 评估了ERSRGs中心基因PPP1R16A的免疫学景观,并通过细胞学实验验证了其生物学功能。
图1 研究总体流程
研究结果
1.肝细胞癌与正常组织之间差异表达基因鉴定
本研究在非批量删除和批量删除条件下对数据集GSE25097、GSE62232和GSE65372的基因进行主成分分析(图2A、B),结果表明成功消除了批次效应。图2C中的火山图显示HCC与正常组织之间存在 763个DEG ,其中 215个基因上调,548个基因下调 。图2D中的热图显示HCC和正常组织之间DEG的表达水平。
图2 肝细胞癌与正常组织差异表达基因分析
2.ERS相关DEG鉴定
图3A通过312个ERSRGs和763个DEG交集得到1 1个ERS相关DEG ,使用RF分析进一步筛选了11个ERSRG。图3B残差图可以看出,当分支数为125时,残差最小。在RF树中对11个ERSRG进行评分,最终根据基尼系数降序选择 得分>20的7个ERSRG (图3C)。如图3D所示,当11个ERSRG中有6个被保留时,均方根误差最小。通过RF分析中的7个ERSRG和SVM分析中的6个ERSRG的交集,得到SRPX、THBS4、CTH、PPP1R16A等,最终 确定THBS1 用于构建下图的人工神经网络(图3E)。
图3 ERS相关差异表达基因鉴定
3.肝细胞癌神经网络预测模型的构建与验证
建立神经网络 ,6个神经元 (SRPX、THBS4、CTH、PPP1R16A、CLGN、THBS1)作为输入层,2个神经元(HCC和正常组织)作为输出层(图4A)。 当隐藏层包含5个神经元时,模型的预测性能在训练组中最高 ,AUC值为0.979(图4B)。在其他3个验证组中也对该人工神经网络预测模型的效率进行了评估。在GSE121248、GSE45267和GSE84005中,ANN模型的AUC值分别为0.958、0.936和0.970(图5C-E)。总之,该模型在预测HCC方面是一个潜在有力工具。
图4 肝癌人工神经网络预测模型的构建与验证
4.内质网应激核心基因对免疫浸润的影响值得关注
对6种ERSRGs在HCC和正常组织中的表达情况进一步研究,与正常组织相比, HCC组织中CLGN、PPP1R16A和THBS4的表达水平显著升高 (图5A),近一步分析相互作用确定是共现还是互斥关系(图5B)。为探索ERSRGs促进HCC发生的潜在机制,分析了6种ERSRGs表达水平与免疫细胞浸润和免疫相关通路的关系(图5C),THBS1和SRPX与大多数免疫细胞和免疫相关通路呈显著正相关。最后使用ggcor和ggpplot2分析核心基因与两种免疫活性分子之间的表达相关性(图5D)。
图5 6种ERSRGs的表达及免疫浸润分析
5.6种ersrgs相关的生存、突变和甲基化分析
Kaplan-Meier显示, CLGN和PPP1R16A两种基因 低表达的HCC患者的总生存期明显长于高表达的HCC患者(图6A、C)。然而,SRPX、THBS1、THBS4高表达与低表达对HCC患者预后的影响无显著差异(图6D-F)。研究还分析了核心基因对应的启动子的甲基化状态,发现 CLGN、CTH、PPP1R16A、THBS1的启动子 甲基化程度在对照组和肝癌细胞组之间存在显著差异。CLGN的启动子甲基化水平在肿瘤组中较强,而其他三个基因的甲基化水平在肿瘤组中显著降低(图6H-M)。
图6 与ERSRGs相关的存活、突变和甲基化分析
6.PPP1R16A基因免疫景观的单细胞测序分析
UMAP图显示所有细胞都可以标注为 七种类型 ,包括肝实质细胞、巨噬细胞等(图7A),气泡图显示了七个不同注释细胞组中使用的标记基因(图7B)。单细胞分析显示 PPP1R16A主要在恶性肝实质细胞中表达 (图7C),Go富集显示,PPP1R16A高表达的细胞主要与脂质代谢过程有关(图7D)。KEGG结果表明 PPP1R16A在肝实质中高度富集 (图7E),进一步聚类可知在所有重要的信号通路中,有7条通路具有聚类模块化特征,是更核心的信号通路(图7F)。
图7 单细胞RNA-seq数据分析
7.肝癌中PPP1R16A的上调和PPP1R16A的下调可显著抑制HCC细胞的增殖、侵袭和迁移能力
QRT-PCR实验显示,与正常肝细胞相比,人HCC细胞系PPP1R16A表达更高(图8A), 将siRNA转染到Hep3B和HCCLM3细胞中,选择最有效的sirna-ppp1r16a#1进行后续实验(图8B、C)。 CK8实验表明 ,PPP1R16A敲低 可抑制 Hep3B和HCCLM3细胞的增殖能力(图8D)。同时, 划痕实验和Transwell实验表明 ,敲低PPP1R16A可抑制HCCLM3和Hep3B细胞的迁移和侵袭能力。观察结果表明 PPP1R16A是HCC细胞的正调节因子 (图8E、F)。






请到「今天看啥」查看全文