最近流行大数据,分析分析就能发paper。不做实验就能发文章,这么好的事儿,朕不能错过。研习一篇,各位小主儿也雨露均沾下。
肺鳞状细胞癌中异常表达的lncRNA的临床作用:基于RNA测序和微阵列数据挖掘的研究,回复170704可下载文献,一月有效。
TCGA数据库中异常表达的肺鳞状细胞癌(LUSC)lncRNA
通过R语言计算每个LncRNA的表达水平。根据计算标准,在LUSC中获得了884个异常表达的lncRNA,包括669个高表达和215个低表达(Fig.1A)。
异常表达的lncRNA进行ROC分析,列出了在ROC曲线下面积(AUC)超过0.95的前75个lncRNAs ,这些lncRNA可能在LUSC的发生中起重要作用,具有LUSC高诊断价值(表1,未列全)。
AUC:Area Under Curve被定义为ROC曲线下的面积,面积值在1.0和0.5之间。ROC曲线下的在AUC>0.5的情况下,AUC越接近于1,说明诊断效果越好。AUC在 0.5~0.7时有较低准确性,AUC在0.7~0.9时有一定准确性,AUC在0.9以上时有较高准确性。
选择前10名异常表达的lncRNA(表2)进一步分析,包括表面活性剂相关1(SFTA1P)、LINC00968、LINC00961、LINC01572、RP1-78O14.1,相邻的非编码发育调节RNA(FENDRR)、LINC01314、LINC01272、GATA6-AS1和MIR3945HG。
LUSC中LINC01572的水平明显高于相对应肿瘤组织。相反,其他9个lncRNA在LUSC组织中均明显下调(Fig.2)。
这10个异常表达的lncRNA显示出具有高诊断价值,将LUSC与非癌性肺组织区分,AUC均大于0.99(Fig.3)。
生存分析显示,SFTA1P、LINC01272、GATA6-AS1、MIR3945HG与LUSC的存活时间显著相关(Fig.4)。
多变量cox分析显示,SFTA1P可能是LUSC的独立预后指标(补充表1)。当关注这10个lncRNA与LUSC进展之间的关系时,有几个lncRNA与LUSC的一些临床数据密切相关(表3,Fig.5)。
特别的,LINC01572和LINC01314的水平可以辨别LUSC患者的早期阶段。从TCGA平台提取FGFR1(成纤维细胞生长因子受体1)的原始数据,FGFR1和10个lncRNA之间存在显著正相关(Fig.6)。
这十个关键lncRNA的共表达基因由WGCNA测定。结果发现:120个基因与SFTA1P共表达;47个基因与LINC01272共表达;46个基因与RP1-78O14.1共表达;18个与LINC00968共表达;8个与 LINC00961共表达;4个与 LINC01314共表达;2个与GATA6-AS1共表达;1个与MIR3945HG。而WGCNA显示:没有基因与FENDRR、LINC01572共表达(Fig.7)。
cBioPortal中OncoPrint显示:501例中有69例(14%)可以获得具有遗传性的改变,(RP1-78O14.1除外,其数据在cBioPortal中不可用)。只有SFTA1P、LINC00968、LINC00961、FENDRR具有遗传改变,包括:扩增,深层缺失和mRNA上调(Fig.8A)。
有趣的是,发生遗传改变的病例与没有改变的患者相比生存较差(Fig.8B)。CBioPortal还提供了这10种lncRNA共存可能性(表4,未列完)。
结果:STA1P共表达基因在溶酶体中最为富集;LINC01272共表达基因在膜成分中最为显著。同时,与RP1-78O14.1共表达的mRNA大多是是肌动球蛋白结构组织。结果(表5)。
此外,还分析了与这几个lncRNA共表达的所有mRNA中富集最多的GO term,显示质膜为最多(表6)。
使用GEO数据验证这8种lncRNA的表达和ROC曲线
从GEO数据集(GSE30219)中筛选,研究这八个lncRNAs在LUSC组织中的表达水平,其中SFTA1P、LINC00968、LINC00961、RP1-78O14.1、FENDRR、LINC01314和LINC01272可以观察到表达显著降低,而GATA6-AS1的表达显著较高(表7)。
8种LncRNAs 的ROC曲线,显示对于LUCS具有良好的诊断价值(Fig.9).
基于LUSC临床样本的验证(通篇文章,唯一正儿八经做的实验)
实时RT-qPCR,检测12个配对临床样品中LINC00968、FENDRR的表达。在这些患者中,LUSC组织的LINC00968平均表达水平明显低于非癌性肺组织(Fig.10A);LINC00968的AUC 为0.778(P=0.0021,Fig.10B);
LINC00968和LUSC肿瘤发生之间没有显著相关性(P=0.508,Fig.10C);
FENDRR表达趋势与LINC00968相似,LUSC组织中FENDRR平均表达水平明显低于非癌性肺组织(P=0.0015,Fig.10D);FENDRR的AUC为0.882(P=0.0015,Fig.10E);
FENDRR与LUSC肿瘤发生具有相关性(P=0.031,Fig.10F)。
基于TCGA,22种类型癌症中关键lncRNA表达的进一步分析
基于GEPIA的结果:肺腺癌和直肠腺癌中发现SFTA1P下调,而肾癌细胞中SFTA1P的表达显著上调;
在乳腺癌、肺腺癌和胸腺瘤中发现:与非癌组织相比,这些癌症组织中LINC00968水平显著降低;
与LUSC结果一致,在乳腺癌、肾乳头状细胞癌、肺腺癌中证实了LINC00961的表达较低;
另外几种类型的癌症,包括宫颈鳞状细胞癌、肾癌细胞、肾乳头状细胞癌、肺腺癌也显示RP1-78O14.1表达较低;
此外,膀胱尿路上皮癌、结肠腺癌、肺腺癌、前列腺腺癌、直肠腺癌中FENDRR显著下调。
同时,结果还显示:胆管癌、食管癌、KICH,KIRC,KIRP,LUAD、、、、等等中LINC01314的下调,以及在甲状腺癌中的上调。
尽肺腺癌中发现LINC01272的表达较低,但是CESC,COAD,ESCA,KIRC,KIRP,READ,胃腺癌(STAD)和子宫内膜癌(UCEC)中LINC01272显著上调。
GATA6-AS1可能在几种癌症中起肿瘤抑制作用,包括BLCA、CESC、ESCA、LUAD、嗜铬细胞瘤、PCPG和UCEC等。
然而,MIR3945HG在LUAD中仅显著降低,并且在这22种癌症类型中,癌组织和相应非癌组织之间的LINC01572表达没有显著差异。(源于GEPIA,Fig.11)
通篇文章,更像是高中数学&几何中的推理:
①cBioPortal:http://www.cbioportal.org/网站整合了上百个肿瘤基因组数据,无需注册即可使用,而且还可以直接生成图表;
②WGCNA:基因共表达网络分析
③WTF the GEPIA?http://gepia.cancer-pku.cn/
本篇文章5分Plus,仅有RT-PCR实验。有些<3分的文章,完全分析无实验。作为小青椒&小大夫,没有经费,晋职称需要;挣科研奖励养家糊口需要;积累申请课题SCI需要。辣么不得不多动动脑子,在大数据时代玩转各种数据库。