中国医学科学院基础医学研究所、协和医学院基础学院的王晓月教授带领的团队与芝加哥大学的Kevin White实验室合作,使用了一种新方法解析GWAS位点调控基因表达的功能。这项研究于10月23日发表在Genome Biology上。
本文转载自“ BMC期刊(ID:BMC2000)”。
全基因组关联分析(genome-wide association studies, GWAS)已经被广泛用于复杂疾病的遗传位点的分析。 然而,GWAS 发现的复杂疾病相关的遗传变异,即单核苷酸多态性(SNP)位点大多位于基因的非编码区,并且同一区域中连锁的遗传变异(SNP)位点可以多达成百上千个,如何从中找到真正与疾病相关的SNP,并从生物学上诠释其功能及其与疾病的关系,是后GWAS 时代的重大挑战之一。
王晓月博士和刘松博士
中国医学科学院基础医学研究所、协和医学院基础学院的王晓月教授带领的团队与芝加哥大学的Kevin White实验室合作,使用了一种新方法解析GWAS位点调控基因表达的功能。这项研究于10月23日发表在Genome Biology上[1]。他们改进了一种叫做STARR-seq的高通量实验方法,系统性地鉴定了与癌症风险相关的SNP中具有调控基因表达功能的SNP。
STARR-seq 方法最初由奥地利科学家AlexanderStark发明[2],可用于在果蝇的全基因组筛查有增强子活性的DNA片段。原理是利用增强子调控靶基因表达不依赖于空间和距离的特性,将增强子克隆在报告基因之后,以增强子本身作为报告基因的一部分,通过测序检测不同增强子的自身表达从而判断不同增强子的活性。本项目的研究团队在此方法基础上进行了改进,使其不仅可以靶向鉴定特定目标DNA片段的调控活性,还能特异地比较含有SNP两种基因型的片段活性的差异,因此可以用于大规模的鉴定影响调控活性的SNP位点(下文称为调控型SNP)。
研究团队运用此方法,从10673个位于GWAS癌症风险相关区域的SNP中鉴定出70个调控性SNP位点。与DNA元件百科全书 (ENCyclopedia Of DNA Elements, ENCODE)的数据比对发现,这些位点在转录因子结合区域富集,并更有可能破坏转录因子结合。这些证据提示它们可能通过影响其所在区域结合转录因子的能力,从而改变该区域的调控活性。研究团队还对其中两个SNP进行了深入的研究。一个是乳腺癌风险相关的SNP rs11055880,发现它在一个远程作用的增强子中,能调节ATF7IP的基因表达。另一个是位于PDE4B内含子区域的儿童白血病风险位点rs12142375,发现它能调控PDE4B基因的表达,其中G等位基因对应较高的增强子活性,白血病患者中的基因数据也证实了这一调控趋势。
本研究为今后解析非编码区变异的生物学功能提供了一种广泛适用的新方法,所发现的癌症风险相关的调控型SNP,也有助于理解癌症风险的复杂调控机制,未来可能帮助癌症的风险评估。由于非编码区的SNP功能不只是调控基因表达一种,对于其它功能性的GWAS SNP,还有待更多的新方法来系统鉴定和解读。
Kevin.P. White博士和刘毓文博士
本文的第一作者为协和医学院的博士生刘松和芝加哥大学的刘毓文博士,主要合作者还包括曾在Nature Genetics上率先发表前列腺癌GWAS风险位点增强子机制研究的芬兰奥卢大学的Gong-Hong Wei教授及其研究团队。
王晓月教授2010年博士毕业于约翰霍普金斯大学医学院。2010年到2013年在芝加哥大学进行博士后研究。2015年入选中组部第六批青年千人计划。现任中国医学科学院基础医学研究所“协和学者”特聘教授,生物信息中心主任。研究方向为癌症基因组学和生物信息学,主要致力于使用系统生物学方法研究癌症的发生机制并探索可能的疗法,也关注基因组学方法和技术的开发。
1. Liu, S., et al., Systematicidentification of regulatory variants associated with cancer risk. GenomeBiology, 2017. 18:194
2. Arnold, C.D., et al., Genome-widequantitative enhancer activity maps identified by STARR-seq. Science, 2013.339(6123): p. 1074-7.