胰腺癌素有“癌王”之称,所过之处,九死一生。所以研究者们也在探寻它活动的蛛丝马迹(生物标志物),能够及时发现它的窝点和动向,便于迅速准确地出击。流调发现,我国的胰腺癌发病率越来越高,且有年轻化趋势。如果早发现、早干预,5年存活率能有所提高达到15%-25%。所以我们需要找到胰腺癌早期、特异性的生物标志物。
复旦大学附属上海市公共卫生临床中心的汪进教授,在刚刚结束的生物标志物与液体活检论坛上,向大家分享了他的研究团队在胰腺癌生物标志物方面的工作,给我们带来不少启示。
我们知道,胰腺癌的发病因素中,遗传物质的不稳定性有很大的关系,包括一些非编码RNA(ncRNA)的改变。而血循环中的外泌体携带有肿瘤相关的ncRNA,瘤抑制基因的功能,且在肿瘤细胞中有异常表达。汪教授的团队便考虑从外泌体中的ncRNA入手,寻找可用于液体活检的生物标志物。
研究组考虑了circRNA、lncRNA、microRNA,但因为circRNA在外泌体中含量很少,很难检出,而lncRNA需要扩增,提高了成本;microRNA(miRNA)除了避开以上两个缺点外,还有在血循环中稳定,不易被RNA酶降解的特性,为研究带来方便,所以最终选定了miRNA进行深入探索。
既然目标是无创或微创的液体活检,首先就会想到从临床上常用作检测标本的体液中寻找,主要是血浆、胰液、囊液,研究组就兵分三路,从这三种体液中寻找有意义的microRNA;第四第五路分别是meta分析和生物信息学。
汪教授的工作始于2009年,采用TaqMan探针法进行表达谱分析。研究组收集了49例胰腺导管癌(PDAC)和36例对照组血浆,分离出RNA进行检测,得到4个与对照组有明显差异的miRNA。
图A-D分别为miR-21、miR-210、miR-155和miR-196a在对照组和PDAC组的FoldChange
接下来对这4个microRNA做了ROC曲线,计算AUC,评价其诊断效率。它们单独使用的AUC在0.62-0.69之间,而联合应用的AUC能达到0.82,有了显著的提高。
A-D分别为4个microRNA的ROC曲线,E为联合应用的ROC。
此后为了进一步证实其临床应用价值,又扩大样本量做了双盲实验,4个microRNA联用的为0.75,若加上传统的CA 19-9,则能达到 0.93。
从胰液中寻找标志物时已是2014年,此时已经有了研究基础,便能拿到更多的研究经费,可以做用更高大上的微阵列方法了~该研究纳入88位患者,分为训练集(training set)和验证集(validation set)。
训练集有PDAC组6个样本,对照组为来自6个非胰腺疾病、非健康患者(non-pancreatic, non-healthy, NPNH)的2个混合样本。收集胰液做了miRNA微阵列,对Fold Change在1.5以上的49个miRNA做了层次聚类分析,找到4个有价值的miRNA,包括原来报道过在PDAC组织中过表达的miR-205和miR-210,还有未报道的miR-1247和miR-492作为新发现的标志物。
用qRT-PCR对这4个候选miRNA进行了初步验证,PDAC组和NPNH组有明显差异。接下来就要在更大的验证集中进行验证。验证集包括PDAC组44例,CP(慢性胰腺炎组)19例,NPNH组13例。
图为4个miRNA在各组的Fold Change,虽然有些miRNA的CP组和PDAC组差异不明显,但和对照组还是有显著差异。
当然还是要作ROC曲线来评价它们鉴别PDAC和NPNH的效率。除了4个microRNA,也同时做了CA 19-9,以及5者联用的ROC曲线。惊诧的发现,5者联用可使特异性达到100%,AUC也达到了0.99,而4个miRNA联用的AUC为0.92。
A:4个microRNA、CA 19-9以及联合应用的ROC;B:绿色为miR-205和miR-210同时高水平(中值或以上)的患者的总体生存曲线,蓝色为二者非同时增高(即只有一个高或两者都不高)的患者的生存曲线。可见此二者联合应用有判断预后的意义。
做囊液中标志物的搜查时,应用了二代测序(NGS)进行分析。为了早期诊断两种癌前病变的恶化,即胰腺导管内乳头状黏液肿瘤(IPMN)和胰腺囊液性粘性肿瘤(MCN),研究组选取了17例患者,分为低风险组(低/中级异型的IPMN和MCN)6人,高风险组(高级异型)8人,胰腺腺癌(PA)组3人。
先从2个低风险组和2个高风险组样本中检测出13个在高风险组上调的miRNA,2个下调。不过样本量太少,经过伪发现率(FDR)校正后,并不是所有miRNA的差异都有统计学意义。
再用qRT-PCR在所有17个样本中验证miR-216a和miR-217这两个有肿瘤抑制作用的miRNA。结果miR-216a在低风险组 vs 高风险组、低风险组 vs 胰腺癌组有显著差异,而高风险组vs 胰腺癌组则没有差异。这也说明它有潜力区分良性和高风险的癌前病变。miR-217在三组中没有差异,只是有相似的趋势,扩大样本量也许会出现更清晰的结果。
这倒是一个有意思的现象。miR-216a和miR-217据报道在肿瘤组织中是低表达的,本研究确实观察到它们在囊液中表达增高,也经过了qRT-PCR的验证。这是为什么呢?研究组百思不得其解。会不会是肿瘤组织排出来了?还是其他什么机理?可能需要进一步研究。
最后,汪教授还特别鼓励学生利用网络上已发表的成果进行二次分析,即meta分析和生物信息学方法。Meta分析可以通过质控将零散的数据汇总成更大的数据集,得出更有说服力的结果;而生物信息学分析就像投资前的调查,找到最有投资(分子生物实验)价值的分子。
这是2017年做的meta分析,纳入了29个关于胰腺癌与miRNA的研究,做了SROC(summary ROC)曲线,AUC为0.89。
A:总ROC;B:Deek发表偏倚检测。
生信方面,这篇2016年的文章挖掘了GEO、Oncomine两大数据库中关于胰腺癌与miRNA和mRNA的数据。
从GEO中提取了5个miRNA表达谱数据集,用其中的2个发现集(discovery set)做个交集,得到26个共有的差异表达的miRNA(图A),然后在3个验证集中进行确认(图B)。图C是这些miRNA的表达情况。
然后从Oncomine数据库中找到5个关于胰腺癌和基因表达(mRNA)的研究的数据集,把它们的异常表达基因也做个交集,得到260个共同的差异表达基因。
A:上调的有212个;B:下调的有48个。
接着做了IPA通路分析,找到这26个miRNA是靶向260个基因中的53个,接着对这53个基因进行网络与途径分析,发现它们参与胰腺癌相关的4个基因网络和5个经典途径,进一步求证了它们作为胰腺癌生物标志物的可行性。
研究组还做了文献回顾,发现这些基因所编码的蛋白中,有6个会分泌到血浆或血清中,更有发展为液体活检生物标志物的潜力。这样通过生信工具来找下一个研究目标,不就省事多了~
不过这篇生信的文章有点遗憾,忘了感谢NIH的资助,还把作者写漏了,只好撤了……
参考文献:
MicroRNAs in Plasma ofPancreatic Ductal Adenocarcinoma Patients as Novel Blood-Based Biomarkers ofDisease
Circulating microRNAs inPancreatic Juice as Candidate Biomarkers of Pancreatic Cancer
Next generation sequencing ofpancreatic cyst fluid microRNAs from low grade-benign and high grade-invasivelesions
Clinically relevant circulatingmicroRNA profiling studies in pancreatic cancer using meta-analysis
Retracted: Identification ofNovel Biomarkers for Pancreatic Cancer Using Integrated Transcriptomics WithFunctional Pathways Analysis