专栏名称: 生信圈
关注生物医学大数据、以及数据分析方法在转化医学研究中的应用进展,讨论与生物信息相关的一切话题。
目录
相关文章推荐
抽水蓄能与储能技术  ·  抽水蓄能发电电动机磁轭结构形式分析 ·  3 天前  
北京大学  ·  北大刘毅,国家自然科学奖! ·  4 天前  
北京大学  ·  北大刘毅,国家自然科学奖! ·  4 天前  
超前一步午后一股  ·  特写||华为鸿蒙产业链全梳理(惠存收藏 ... ·  6 天前  
超前一步午后一股  ·  特写||华为鸿蒙产业链全梳理(惠存收藏 ... ·  6 天前  
剁椒TMT  ·  续保提价,不给续保,新能源车主慌了 ·  1 周前  
剁椒TMT  ·  续保提价,不给续保,新能源车主慌了 ·  1 周前  
51好读  ›  专栏  ›  生信圈

Uanle TCGA数据挖掘:预后相关的甲基化位点及构建重要基因的风险模型

生信圈  · 公众号  ·  · 2017-06-30 21:35

正文

TCGA数据库想必大家都不陌生,它以丰富的数据类型、大规模的样本量和完备的临床信息著称,对肿瘤研究者来讲是一座宝贵的矿藏。数据类型主要包括mRNA芯片/测序、miRNA测序、甲基化芯片、CNV等多种组学,疾病包括39种常见癌症。我们今天给大家介绍一个预后相关的甲基化与表达谱整合的数据分析思路。


流程图


具体步骤简要介绍:

1.甲基化数据差异分析

2.各差异甲基化位点的生存分析

3.差异甲基化位点-mRNA相关性分析

4.mRNA表达水平的生存分析

 

通过以上步骤筛选得到关键研究因子(文献调研),作为进一步深度研究分析的对象。


关键甲基化水平beta值分布图

 

5.根据上一步所选的甲基化位点,将患者分为高/低甲基化组,筛选组间差异基因。

6.利用Cox模型和ROC曲线构建预后生存相关的signature基因集,并计算每个患者的Risk score。


K-M曲线和ROC曲线


7.利用验证数据集进行Risk score打分系统的验证。

Risk Score打分系统结果

8.与Risk Score正/负相关的基因集的GO和通路分析。

9.实验验证。

 

以上流程借助COX回归模型,结合TCGA的甲基化和mRNA测序数据,从海量的数据中筛选出影响预后的甲基化位点/基因集合,通过风险评分区分高/低风险患者,具有很高的科研和临床价值。大家看明白了吗?不妨一试!

 

参考文献:


1.    Wang W, Zhang L, Wang Z, et al.A three-gene signature for prognosis in patients with MGMT promoter-methylatedglioblastoma[J]. Oncotarget, 2016, 7(43): 69991-69999.

2.    王可, 赵荣仙,杨素莲, 等. 基于 TCGA 数据库挖掘肺腺癌预后相关的甲基化位点和基因[J]. 南京医科大学学报: 自然科学版, 2016 (6): 665-669.



本文转载自 云生信 ,如有侵权请联系删除。

推荐阅读
  1. 迄今为止最大规模:1000个新参考基因组数据发布!

  2. 液体活检与医学影像学诊断的临床相关性

  3. 全基因组关联性研究阐明诱发肺癌的新型易感位点

  4. 基因调控网络建模研究获进展,有望注释表型相关遗传变异

  5. 液体活检与医学影像学诊断的临床相关性

生信圈致力于每天推送生物信息干货,让大家了解生信行业。旨在通过更多的交流促进行业的发展。我们一直在寻找志同道合的伙伴!投稿邮箱:[email protected]

生信圈

微信ID:bioinfor-club

1.点击历史信息,查看更多内容

2.长按右侧二维码,关注更多生物信息干货

长按二维码关注