挑圈联靠解读18分+预后型Biomarker生信文章套路
小伙伴们,大家好,我是汇然。今天来为大家分享一篇2018年10月发表在Annals of Oncology的一项研究,题目为“Association between PD-1 mRNA and response to anti-PD-1 monotherapy across multiple cancer-types”。影响因子为18.274。本期分享我会带大家以“挑圈联靠”的生信思维来解构范文的思路框架,让大家有种学习完就迫不及待想要发文的冲动!哈哈,言归正传,我们先来介绍一下背景知识。
挑圈联靠公众号上线了两个比较哇塞的小功能,
1. 回复期刊名得影响因子,支持缩写和模糊匹配;
2. 菜单提供数据库分类索引,很快官网也会上,找数据库不迷路。
我们都知道癌症的特点是不同的基因改变积累,导致癌细胞表面出现不同的新抗原表达。人体免疫系统是机体发现和消灭肿瘤细胞的可靠“人体警察”。然而,肿瘤细胞可以利用机体内的免疫调节剂促进其自身发生“免疫逃逸”,人们先前认为的可靠“人体警察”则成为肿瘤逃逸的“帮凶”,这一发现影响了免疫抗癌疗法的发展趋势,比如抗PD-1或抗CTLA4抗体“免疫检查点抑制剂”。抗PD-1药物如nivolumab或pembrolizumab对超过15种癌症类型的临床疗效显著。这些药物对22种癌症的总体反应率(ORR)在0%到50%之间各不相同。因此,有必要筛选抗PD-1治疗的获益人群。那么预测抗PD-1单药治疗疗效的可重复性生物标记物可能具有临床价值。在作者团队先前的研究中已经报道了使用nCounter平台检测免疫相关基因(包括PD-1)的表达是可重复的,且与65例晚期肿瘤患者的抗PD-1单药疗法疗效相关。在这里,我们假设肿瘤样本中PD-1 mRNA的丰度可以解释不同类型肿瘤抗PD-1单药治疗后总ORR的差异。最近的研究支持了通过IHC检测PD-L1表达作为pembrolizumab在非小细胞肺癌(NSCLC)中的潜在生物标志物的作用。然而,它对其他癌症类型的预测价值,或与其他抗PD-1药物,是有争议的。此外,基于的PD-L1检测有重要的局限性,如所用抗体的敏感性不同,以及在评分和切断测定时的主观性。因此,识别可重复应用的生物标志物来预测抗PD-1单药治疗的疗效可能具有临床价值。之前,我们报道了利用nCounter平台表达的免疫相关基因,包括PD-1,是可重复的,并与抗PD-1单药治疗65例晚期癌症[1]患者的疗效相关。于是作者提出科学假设:肿瘤样本中PD-1 mRNA的丰度可能解释抗PD-1单药治疗癌症后观察到的总体应答率(ORR)的差异。本文围绕着“肿瘤样本中PD-1 mRNA的丰度可能解释抗PD-1单药治疗癌症后观察到的总体应答率(ORR)的差异”这一问题展开生物信息学分析。也就是说范文主要想通过PD-1 mRNA表达水平预测不同类型肿瘤抗PD-1单药治疗的预后,是一篇预后类型的生信文章。创新点就在于抗PD-1单药治疗与肿瘤适应性免疫反应间的关联,是否可以通过PD-1表达水平来预测呢?那么这样一个临床问题是如何通过生信分析方法来解释呢?答案还是“挑圈联靠”!我们也按照生信文章四步曲来锻炼一下生信思路设计,根据科学假设“挑”也就是选择差异基因。既然是研究免疫检查点抑制剂疗效,肯定需要免疫相关基因。这里可能会需要免疫相关基因列表,从哪里获得呢?可以从免疫数据库,文献报道,公共数据集等等获得。问题又来啦!有了免疫相关基因我们可以用来做什么呢?我们可以分析这些基因与我们的主角PD-1间的相关性呀~可以进一步缩小Hub基因范围,得到与PD-1相关的共表达基因呀~之后就是功能富集,分子交互,临床应用这一套流程做下来。有了创新的差异分子集合发不到18分,灌灌水也是可以了吧~还能套上热点问题高调的讨论一番,让审稿专家们眼前一亮,即便文章一看上去中(套)规(路)中(满)矩(满),也会加上不少印象分!感慨一番~我们还是回到文章当中来,18分+的文章肯定是有它自己的特色,绝不仅是差异分析、功能富集这么简单。通过科学假设我们可以看出文章中肯定用到了临床试验,那就需要组织样本。换做我们这些小学生没有临床样本可以通过哪些方法代替呢?当然,查阅文献必不可少,自己没有数据可以参考公共数据库,自己没有组织也可以借用别人的组织样本信息嘛~如果有条件的小伙伴,用上自己的样本那当然又是大大的加分项!有了临床样本就有了蛋白水平的表达差异,同时有了临床信息。接下来就要靠临床意义,还是这一套分析流程,换汤不换药。接下来我们边学分析方法,边剖析分析结果。作者对TCGA数据库中泛癌标本的RNAseqv2数据进行分析。研究18个免疫相关基因特征和547个免疫相关基因(包括PD-1)。分析每个基因/特征和文献报道的抗PD1单药治疗后ORR之间的相关性。为了将分析结果转化为临床,作者使用nCounter平台分析了17种肿瘤类型中的773例FFPE肿瘤样本的PD-1 mRNA表达。为了检测PD-1 mRNA、PD-L1的免疫组化作者评估了117例晚期肿瘤患者接受抗PD1单药治疗的独立数据集。表达差异 & 分子交互
TCGA中与表达相关的PD-1免疫相关基因
首先,作者合并了TCGA数据库中34种不同肿瘤的10078个样本的RNA序列数据(Fig.1A)。从15557个基因中选出包括PD-1在内的547个免疫相关基因(Fig.1B)。随后利用DAVID数据库分析PD-1的共表达基因,以r>0.80为限定值筛选了强相关的30个基因(包括CD3和CD8A),这些基因在CD8 T细胞活化等生物学过程中显著富集(P<0.001)(Fig.1C)。这与单基因分析结果一致,PD-1与T细胞活化的免疫相关基因表达特征(GES)强相关(r>0.80)。PD-1表达与其他免疫检查点抑制剂如LAG3(r=0.75)、PDL2(r=0.55)和PD-L1(r=0.45)之间的相关性较低(Fig.1D)。研究发现34种肿瘤的PD-1表达在不同肿瘤类型之间和同一肿瘤类型之内的表达变异性很大.图中红线在每个cancertype表示值的表达式。作者将样本按照整个队列中PD-1的中位表达量进行排序,水平线表示50%和80%的PD-1表达量。例如,当以组合矩阵中第80百分点作为界定PD-1高表达与PD-1低表达的临界值时,每种肿瘤类型中PD-1高表达肿瘤的比例在0%~84%之间(Fig.1E)。疗效相关性分析 & 临床意义
免疫相关基因表达和抗PD-1抗体疗效
Fig.1F比较了每一种癌症类型中高PD-1比例进行分析的图以及抗PD-1单药治疗后报告的总体应答率(ORRs)。在PD-1平均表达最高的肿瘤类型中,接受抗PD-1单药治疗(如黑色素瘤)患者的ORR最高。在PD-1平均表达最低的肿瘤类型中,接受抗PD-1单药治疗(如胰腺癌)患者的ORR最低。这些数据表明,不同肿瘤类型之间和同一肿瘤类型之内的PD-1表达丰度可能与抗PD-1疗效有关。为了确定不同肿瘤类型中生物标记物高表达肿瘤的比例,作者在组合矩阵中评估了6种不同的临界值(即第50至第90百分点和平均值)。结果显示,在565个生物标记物中(即547个个体基因和18个GES),PD-1与ORR高度相关(r=0.74~0.91),并且与被评估的6个截止点的前三个生物标记物保持一致(Fig.1G)。在本研究中还描述了PD-1高百分比(80%)与以往文献报道的不同实体肿瘤抗PD-1单药治疗后ORR的相关性(Fig.1H)。为了探讨PD-1 mRNA和TMB之间的关系,作者使用TCGA数据库中来自8792个肿瘤样本和31个肿瘤类型的PD-1 mRNA和TMB数据。在这个组合数据集中,PD-1 mRNA和TMB之间没有相关性(r=0.09)。然而,PD-1高表达肿瘤的TMB平均值(9.44)明显大于PD-1低表达肿瘤的TMB平均值(5.61;P<0.001)。并且TMB与ORR之间的相关系数为0.61(P=0.011),而PD-1 mRNA(80%作为截止值)与ORR的相关系数为0.91(P <0.001)(Fig.S3)。这些计算机分析结果表明,与TMB相比,PD-1 mRNA可能是一个更好的抗PD-1疗效的预测指标。作者利用了临床773个代表17种肿瘤类型的组织样本,分析不同肿瘤类型的PD-1表达,并确定了第80%的表达值,该百分点定义了PD-1高表达与PD-1低表达的肿瘤(80%表达值=6.3)(Fig.2B)。接下来,比较了内部数据集和TCGA数据库(Fig.2C)之间每种癌症类型中PD-1高表达肿瘤的比例。在两个数据之间,16种肿瘤类型中15种的PD-1高表达肿瘤的比例没有显著差异(Fig.2D)。与我们之前根据科学假设推测的分析方法一致,作者以117例接受抗PD-1单药治疗的晚期肿瘤患者根据PD-1 mRNA预先确定的临界值(6.3)“靠”临床意义,结果显示28.2%的样本被确定为PD-1高表达(Fig.2G)。与是否具有良好的临床疗效对比,以PD-1高表达肿瘤的ORR为51.5%,而其余的ORR则为23.8%,均具有显著统计学意义(Fig.2H)。在这里,作者选用的验证数据集包含84个可评估样本,发现PD-1 mRNA与sTILs这两个生物标志物之间的相关性系数r=0.53,表示相关性并不很强。从抗PD-1疗效的相关性来看,连续变量sTILs的表达与疗效不存在显著相关性(OR=1.01;95% CI:1~1.1;P=0.197),而PD-1作为一个连续变量与疗效显著相关(OR=1.32;95% CI:1.0~1.73;P=0.034)。在以63%为限定条件的74个可评估样本中,PD-1 mRNA与PD-L1两个生物标记物之间没有发现相关性(r=-0.04)(Fig.S4)。最后,作者基于PD1 mRNA的表达及逆行无进展生存分析(PFS)(Fig.2I)。首先,我们明确本篇范文的目的就是更好地了解与抗PD-1抗体药物活性相关的生物学特征,并确定观察疗效的预测性生物标志物。目前,免疫组化检测PD-L1表达仍然是pembrolizumab治疗NSCLC唯一被认可的伴随诊断,但该生物标记物存在严重的技术局限。同时,PD-L1在其他肿瘤和其他抗PD-1药物(如nivolumab)中未能发现其具有预测性。因此,有必要借助诸如nCounter这样已被报道具有高度可重复性的平台,在临床上实施稳健且可重复的基因组分析。作者比较自己团队来自不同的研究队列内部泛癌数据库样本和TCGA数据库(早期疾病>90%)之间PD-1高表达的比例,结果是相似的。这一结果表明,在同一类型肿瘤和不同类型肿瘤之间的T细胞活化量是一个基于人群的稳定现象。除基因表达外,也出现了其他抗PD-1治疗敏感性的遗传生物标志物。其中最有潜力的是肿瘤突变负荷(TMB)。抗PD-1治疗后ORR最高的肿瘤类型实际上也是TMB最高的肿瘤类型。并分析之前的研究,有观察到TMB与其疗效直接相关。然而,TMB是否能直接预测其他肿瘤类型的抗PD-1治疗疗效还需要证明。此外,还需要进一步的研究来确定TMB的分析有效性和临床实用性。TCGA数据与我们的和其他研究中的ORR进行计算机分析比较在临床试验之外治疗的晚期肿瘤患者(主要是黑色素瘤和NSCLC)的有限和异质性数据集中,评估了PD-1表达和抗PD-1疗效的直接关联,并证实基于PD-1表达的抗PD-1的疗效梯度。总之,作者的研究结果与假设一致:使用PD-1 mRNA表达水平来识别预先存在且稳定的适应性免疫反应,可以预测不同类型肿瘤抗PD-1单药治疗的预后。小伙伴们在学完这篇18分+干湿结合预后型Biomarker文章后有没有受到些生信思维上的启发呢?只要明确研究目的,再去赵相关的数据集,利用“挑圈联靠”的思路一步步做下来,你也可以发表高分生信文章呢!后台回复“汇然18”获取范文文献,如果你对这样的学习方式感兴趣,或者有什么意见或建议,请在下方留言~我们下期再见吧,拜拜!
参考文献
[1]Prat A, Navarro A, Paré L et al. Immune-Related Gene Expression Profiling After PD-1 Blockade in Non–Small Cell Lung Carcinoma, Head and Neck Squamous Cell Carcinoma, and Melanoma. Cancer Research 2017; 77: 3540-3550.[2]Pare, L., et al., Association between PD-1 mRNA and response to anti-PD-1 monotherapy across multiple cancer types. Ann Oncol, 2018. 29(10): p. 2121-2128.
欢迎大家关注解螺旋生信频道-挑圈联靠公号~