数据来源:
从TCGA、ICGC和GEO获取RNA表达水平数据和临床元数据;从ICGC和GEO获取八个PAAD单细胞RNA测序数据集;从HPA下载免疫组织化学(IHC)数据。
免疫组成分析和免疫亚型聚类:
使用IOBR包的CIBERSORT算法根据 RNA 表达数据量化22种免疫细胞类型的组分;ConsensusClusterPlus包基于免疫浸润进行共识聚类分析;ESTIMATE包计算StromalScore、ImmuneScore和EstimateScore以定义热和冷肿瘤聚类。
差异表达基因和miRNA分析:
使用limma包的voom算法分析热肿瘤和冷肿瘤之间的DEGs,并计算其与PAAD患者的miRNA表达数据的相关性。
WGCNA分析:
使用WGCNA包分析热肿瘤和冷肿瘤中的共表达基因网络,模块的相关系数要大于0.3。
构建预后模型:
使用survival包Cox回归模型筛选出与预后相关的基因,并应用多种ML算法(ANN、RF、lasso、Enet、XGBoost等)来构建预后模型,LOOCV框架来评估模型的稳定性和准确性。
药物预测:
从药物敏感性基因组学数据库获取药物敏感性数据,并使用oncoPredict包预测药物的IC50值。
分子对接分析:
使用DOCK软件预测小分子与蛋白质复合物的结合模式,并利用UCSF Chimera进行可视化。