专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
生信人  ·  好的临床问题,意味着更少的分析 ·  3 天前  
BioArt  ·  专家点评Nature | ... ·  昨天  
51好读  ›  专栏  ›  生信人

TP53的哥哥TP63泛癌研究

生信人  · 公众号  · 生物  · 2020-04-17 08:02

正文

素有“基因组卫士”之称的抑癌基因 TP53 在调控细胞周期、细胞凋亡和维持基因组稳定过程中的重要性,相信大家是早就熟知了的。今天,小编跟大家分享的这篇文章是关于它的家族成员 TP63 的, TP63 有多种异构体 ( 即基因的可变剪接产生不同的转录本 ) ,这些异构体根据其 N 端转录起点的不同分为两种:较长TA异构体和较短DN异构体 (DNp63 TAp63) TA 异构体能抑制细胞的无限增殖,而 DN 异构体则会促进细胞的生长和迁移,并可以拮抗 TP53 蛋白和 TA 异构体的功能。
TP63 isoform expression is linked with distinct clinical outcomes in cancer
TP63 异构体表达与癌症不同临床结果的关联

目前,已知 TP63 在人类膀胱癌中是普遍表达的,这篇文章就利用 TCGA 中的数据综合分析了 TP63 异构体的表达及其与膀胱癌和其他人类癌症的关系。该研究发现, DNp63 异构体在癌症中表达最普遍,其高表达通常预示着较好的结果,而 TAp63 的表达则与较差的临床结果相关。下面,咱们详细看一下作者的分析流程和研究结果。
数据和方法
数据获取与处理
作者首先下载了 TCGA 29 种疾病的双端 RNA 测序数据 ( 删除了 4 种数据集为单端测序的疾病 ) 以及病人的临床数据;然后将 膀胱尿路上皮癌(BLCA) 数据读段通过 STARv2.5.2 比对到 hg38 参考基因组,并用 Cufflinksv2.2.1 识别潜在的 TP63 新异构体;同时,对所有 29 种疾病的测序数据用 Salmonv0.11.3 进行比对和量化 ( 校正序列、 GC 和位置偏差 ) TPM 值的标准化方法为上四分位数, z-score 值用 log2 TPM 计算所得;最后,对于每位患者,通过将某一种特定异构体的所有转录信号进行加和来构建 TP63 异构体分组。
统计方法
数据的统计分析和可视化都是基于 R 完成的。首先,作者用 Cox 比例风险回归模型分析了 TP63 基因以及异构体的表达同 TCGA 泛癌数据集中患者的生存之间的关系;然后,通过计算患者群体表达值的 五个阈值:第 5 10 50 90 95 百分位数 ,患者被分为高、低 TP63 基因及异构体表达组,并利用 KM 图进行可视化。
作者通过一个加权模型从 GSEA 提供的基因集数据库 MSigDB 中下载了 v6 版基因集,并用 Wilcoxon 检验 所得的 - log10p 将基因做了排秩,以量化患者基因表达的差异性。 FDR<= 0.05 的基因集认为是显著的,此外,作者还从 HPRD 数据库获取了蛋白互作数据。
cDNA 提取及其他分析
文章使用到的膀胱癌细胞系有 253J UM-UC5 UM-UC14 UM-UC13 UM-UC10 ,作者最终获得了它们的 RNA 。并且,对于未注释的 TP63 异构体,作者还做了 PCR 验证以及免疫印迹 该过程小编就不在此赘述了。
结果
TP63 基因在泛癌中的表达及与生存的关系
作者将 29 种疾病,总计 8519 名患者的 RNA-Seq 和临床数据进行了标准化处理,以综合分析 TP63 基因的表达同患者结果之间的关系。跟已有的研究结果一致,作者发现在鳞状组织学相关癌症中 ( 宫颈癌、肺鳞癌等 ) TP63 均表现出高表达,在膀胱癌中其次 ( 1.a) 。通过 Cox 回归分析,研究发现 TP63 较高水平的表达与胶质瘤、皮肤黑色素瘤和胰腺癌生存变短显著相关,而在乳腺癌、肺鳞癌和膀胱癌中情况则相反 ( 1.b) 。在 BLCA 样本集中, TP63 的表达是双峰的,大部分是高表达 ( 1.c) ,而且这些高表达的患者,他们的平均总生存期 (OS) 显著高于低表达患者 ( 1.d)

图1. TP63表达的泛癌分析
膀胱癌中 TP63 异构体的识别
基于已有研究,作者假设 TP63 的差异效应可能与 TP63 异构体表达的多样性有关。为了构建一个比较全面的 TP63 异构体集合,作者从 Refgene Gencode 数据库获得了相关的注释信息 ( 共挖掘出 13 TP63 异构体 ) ;并用 de novo 异构体挖掘方法识别了未注释的 TP63 异构体 ( 基于 Cufflinks ) DNp63alphaP DNp63betaP ,作者通过 PCR 证实了它们在膀胱癌中的表达,因此,最终确定了 15 TP63 异构体 ( 2)

2. 膀胱癌中 TP63 异构体的识别
TP63 异构体表达的量化
作者用 Salmon 方法将单个亚型在膀胱癌以及其他癌症中的表达进行了量化。在膀胱癌中,多数为 DNp63 组的异构体 ( 3.a) ,在一组独立的原发性膀胱癌样本集和膀胱癌细胞系中,作者也观察到了相似的表达模式 ( 3.b-c) ,而且在这三组数据集中, DNp63alpha DNp63beta 要稍稍高于其他亚型。在其他癌症中, TP63 异构体具有类似的表达模式,表明了这种量化的非特异性。接下来,作者又分别用定量 PCR 和实时定量 PCR 证实了 Salmon 量化方法可以准确反应 TP63 异构体的相对表达、准确定量 alpha, beta delta TP63 的比例,并一致发现 alpha 最丰富 ( 3.d-g)
该研究对所有 TP63 TP63 alpha 异构体做了免疫印迹,以比较蛋白质和 mRNA 水平的表达是否相似 ( 3.h) ,同作者预期的一样,所有条带都对应着 DNp63 亚型 ( 3.b) 。在 UM-UC5 UC14 细胞系中, DNP63 α异构体的表达定量分别占总 TP63 mRNA 90% 91% ,蛋白表达定量也分别占了 84% 80% 。这些结果证实了用 Salmon 定量可以准确预测 TP63 异构体的表达,并且 DNp63 α是膀胱癌中最主要的 TP63 异构体。在 TCGA 中的其他肿瘤中,大多数具有一样的 TP63 异构体图谱 ( 3.i)

图3. TP63异构体表达的量化
膀胱癌亚型中的 TP63 异构体表达
为了确定TP63异构体的表达在膀胱癌各分子亚型中是否不同,作者分析了 TP63 在基底鳞状、官腔乳突状、管腔浸润、管腔和神经内分泌这五种亚型中的表达(图 4.a) 。结果发现 DNp63 组在基底鳞状以及官腔乳突状亚型中的表达要高于其他三种 ( 4.b) ,而且基底组患者的 TAp63 表达明显高于官腔患者 ( 4.c) ,这表明了 DNp63 TAp63 TCGA 分子亚型中可能具有不同的表达水平。

图4.膀胱癌分子亚型中 TP63 异构体的表达
然后,作者又分析了单个 TP63 异构体与患者生存之间的关系,并对 DNp63 TAp63 做了比较。 BLCA DNp63 阳性和阴性组的 KM 生存曲线表明阳性组患者的总生存期要高于阴性组;而且, DNp63alphaP 阳性组患者的总体生存率也有所提高 ( 5.a) ,在 BRCA LUSC 数据集中也获得了相似的结果。
根据 TAp63 异构体表达的有无将患者分为两组后,作者发现 TAp63 TAp63beta 高表达的患者其 OS 显著低于无 / 低表达患者 ( 2.b) BRCA LUSC 数据集中同样观察到了相似的结果。前面咱们已经说过, TP63 基因表达与存活的关系和膀胱癌分子亚型有关,类似地, DNp63 表达与官腔患者的风险降低显著相关,而 TAp63 则与基底鳞状亚型患者的危险增加显著关联 ( 5.c) 。多变量 Cox 回归分析的结果表明,临床因素中只有年龄以及病理分期与生存有关,在控制这两个变量时, DNp63 的高表达依旧与生存率的提高有关,而且 TAp63 的高表达也同样与死亡风险的增加显著相关 ( 5.d) ,这表明了 DNp63 TAp63 的表达作为膀胱癌独立预后因子的可能性。

图5. TP63异构体的表达与生存相关
接下来,作者又对整个 TCGA 泛癌群体做了单变量 Cox 比例风险回归分析,发现了 DNp63 BRCA BLCA LUSC HR 增加之间的关联,证实了上面 的结果。由于 DNp63 TAp63 表达与生存的关系是相反的,因此研究假设 TP63 HR 的关联可能是由这两种异构体相对丰度的变化决定的。作者将整个 TCGA 肿瘤群体进行了分组 ( 6.c-d) ,由图可知,具有较高 TP63 相关风险的患者,具有较低的 DNp63 比例以及较高的 TAp63 比例。

6. DNp63 TAp63 与生存的关系
DNp63 TAp63 异构体相关的信号通路
已有研究表明 DNp63 TAp63 可以促进预后相关的转录过程,因此,作者使用五分位数法,基于 DNp63 TAp63 的表达水平分别将 BLCA BRCA LUSC 患者进行分层。然后用 符号 Wilcoxon p 对基因进行排秩做 GSEA ,识别出在每个异构体表达水平较高的组中显著富集的基因集。由图 7 的富集结果,可知高水平 DNp63 的患者富集到了表皮细胞分化、角化和皮肤发育相关的基因, TAp63 则富集到了与适应性和先天免疫反应、 VEGF 信号、 Jak-Stat 信号和其他几种转录因子相关的基因集 这意味着 DNp63 TAp63 不同的转录和信号通路有关。

图7. 基因富集分析
总的来说,作者挖掘出了15种 TP63 异构体,比较了它们在膀胱癌各亚型中的表达水平,并对 TAp63 DNp63 异构体做了生存分析以及富集分析,发现了它们与患者生存期之间的关系是相反的,其富集的生物学过程也是不同的。这篇文章的创新之处在于首次对 TP53 异构体表达进行了泛癌分析,但是用到的生物信息学方法都比较简单,也没什么太多的套路,希望大家看完能有所收获呀 !
欢迎关注生信人
转录组 | 甲基化 | 重测序 | 单细胞 | m6A | 多组学
cytoscape | limma |






请到「今天看啥」查看全文