专栏名称: 生信草堂
最权威生信服务,最前沿的生信咨询~
目录
相关文章推荐
植物星球  ·  历尽千辛,种了5年的蜡梅终于也开了几朵 ·  2 天前  
植物星球  ·  被解救之后,王星的谎言...... ·  2 天前  
51好读  ›  专栏  ›  生信草堂

精品论文|如何利用分子实验验证GWAS发现的SNP?

生信草堂  · 公众号  ·  · 2017-09-06 17:00

正文

生信草堂

将会与更多的优秀微信公众号合作,把最优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!

号外,号外,号外

你想和生信分析大神做好朋友么?

你想认识更多爱好生信分析的小伙伴么?

你想让自己的生信分析走上快车道么?

那就赶快加入我们的生信交流微信群吧!

正确加入我们的模式是:

添加我们的微信Edison686868或者mly-1800为好友

标注“加入生信草堂交流群

在群里请大家注明自己本名,单位,研究领域

便于小编管理



2017/8/28

MONDAY

解释遗传关联分析结果的生物功能一直是一个很大的挑战,而这里要分享的文章则是一个成功的案例。通过GWAS 发现的SNP rs965513作为risk allele 对甲状腺癌易感性的机制。这篇文章的研究思路可以帮助我们思考遗传变异位点的潜在生物学机制。位于enhancer或者是非编码RNA中的变异可能很大程度上导致复杂疾病的遗传易感性。



乳头状甲状腺癌(papillary thyroid carcinoma, PTC)是最常见的甲状腺癌症。关联分析指出该疾病很大程度上受到遗传因素的影响。GWAS研究已经发现在9q22区域的单核苷酸多态性(single nucleotide polymorphism, SNPrs965513(非编码)PTC有关(odds ratio~1.8,并且在不同人群中的到了独立重复验证。SNPrs965513)位于 forkhead box E1 (FOXE1)上游的~60 kbFOXE1是一种已知的甲状腺转录因子,对甲状腺的功能,发育和分化至关重要,并且多次被报道与PTC的癌症发生有关。另一个功能性SNPrs1867277)位于 FOXE1启动子区域,也被报道与 FOXE1转录调控有关。

最近,这个研究团队发现了一个甲状腺特异性的基因间长非编码RNA基因(PTC susceptibility candidate 2 (PTCSC2)。在人类基因组中,该基因位于FOXE1的反义链上: PTCSC2transcript isoform c中的exon 1intron 1 FOXE1启动子区域重叠,这说明PTCSC2FOXE1可能共享同一个启动子或者转录调节机制。在甲状腺组织中,PTCSC2有剪切和未剪切两种转录本:剪切转录本有11exons和一些不同的剪切亚型,而SNP rs965513正好位于未剪切转录本上(或者剪切的intron上)。另外,在PTC病人的正常甲状腺肿瘤,rs965513的有害基因型[AA] FOXE1, PTCSC2, TSHR的表达降低显著相关。尽管,这些发现指出了FOXE1

PTCSC2PTC的易感性和肿瘤发生的联系,但是SNP rs965513所产生效应的分子机制还是没有得到解释。

细胞中基因表达是受到DNA调节元件和序列特异性转录因子,以及染色质修饰的影响。因此,该团队推测在rs965513周围(9q22)存在FOXE1 PTCSC2转录的调节元件。于是,他们对9q22位点进行仔细分析和寻找导致PTC的功能性变异。最终,他们根据研究结果暂时得出9q22诱发PTC是通过多种机制,而这些机制涉及到增强子,TFtranscript factor)结合位点,和两个及以上基因的转录变化。

接下来具体介绍该团队的研究过程:


1


重测序,SNP基因分型和Imputation,和Haplotype分析

为了更好的找出9q22位点上的功能性SNPsPTC相关的变异,该团队对22PTC病人的染色体9号:100455000–100622000167 kb)区域进行深度测序并进行LD分析。分析结果显示,在PTC 病人和千人基因组计划EUR个体中,GWAS SNP周围都存在一个33 kbLD block(图一)。

                                             

接着,为了在这33 kb区域中找出与PTC 独立关联的SNPs,该团队在1146 cases1328 controls中,进行imputation haplotype分析。他们发现33 kb中,只有3haplotypes Hap1: OR=1.79Hap2: OR=1.24Hap3: OR=1.54)包含rs965513的有害allele[A]. 另外,对Hap1diplotype 分析发现:杂合Hap1携带者的显示OR=1.695,而纯合显示OR=3.423

总之,这些统计分析结果使他们把研究重点放到~33kb区域。


2


在甲状腺癌细胞系KTC-1和未感染甲状腺组织中,9q22富集了增强子组蛋白标记

考虑到GWAS SNP FOXE1PTCSC2中的位置,他们猜测33kb中的功能性SNPs是调节了重要的顺式转录调节元件,然后,利用公共数据库进行预测(transcription factor (TRANSFAC) databaseEncyclopedia of DNA Elements (ENCODE) ChIP sequencing data HaploReg annotated information), 他们发现有些区域包含了多个TF的结合位点(图二)。因此,他们选择了包含候选SNPs3个区域,并根据它们的远程调控作用设计为enhancer 1enhancer 2,和enhancer 3

接着,该团队就集中研究这三个enhancers。由于组蛋白是活跃型增强子标记,他们,在KTC-1 细胞系和未感染的甲状腺组织中,对H3K4me1H3K27Ac做了ChIp实验,并发现这两种组蛋白显著富集在enhancer 1enhancer 2aenhancer 2b,和enhancer 3(图三)。这一结果为9q22位点存在多种vivo enhancers提供了独立证据。


3


3enhancers元件中增强子活性受到SNP allele的影响

为了研究这3enhancers的功能是不是受到SNP allele的影响,该团队进行了荧光素酶检测实验。他们对这3enhancersrisk allele片段和WT allele 片段分别进行扩增,并连接到荧光素酶报告载体上,然后,在KTC-1细胞系中进行检测。根据观察结果显示,enhancer 2 rs12352658 [G] allelers7847449 [C] allele,和enhancer 3 rs10759944 [A] allele都显示与WT相比显著增强荧光素酶的活性(图四)。由于enhancer 1 没有观察到显著结果,于是,他们在做enhancer 1的荧光素酶实验时,同时转染了表达CEBPa或者CEBPb的质粒。结果,他们观察到,在出现CEBPa或者CEBPb时, enhancer 1 rs7864322risk allele [C]显著降低荧光素酶的活性。

这部分实验结果指出, 9q22位点中至少存在3个增强子元件并且它们的功能受到allele影响。总而言之这部分数据说明GWAS SNP附近有多种allele特异性的远程增强子元件(long-range enhancer element)。


4


针对TFs进行ChIp实验

为了进一步证明3enhancer 元件中的SNPs的功能,该团队利用ChIp实验技术,检测之前预测的TFs能否结合到enhancers上,和这种作用是否受到allele特异性的影响。于是,他们首先在KTC-1细胞系中检测

首先,他们在KTC-1细胞系中检测一系列预测发现的TFs,包括CEBPa, CEBPb,STAT1, YY1, cJUN, ER, TFAP2A 他们发现CEBPa, CEBPb, TFAP2A有显著的结合作用。在正常的甲状腺组织中,CEBPb显著结合到enhancer 1上,但是没有结合到enhancer 3上(图五)。TFAP2A则显著结合到enhancer 2a3上(图五)。接着,他们研究这些TFsenhancers的相互作用是不是具有allele的特异性。在这里,他们用SNaPshot 实验对3个正常的甲状腺样本基因基因分型和用ChIp实验检测TFsenhancers的相互作用。在这3个样本中,SNPs rs7864322, rs12352658, rs10759944的基因型都是杂合的。在enhancer 1中,CEBPb结合到WT allele中的能力要比在risk allele中更强。在enhancer 23中,TFAP2A也同样更偏好于结合到WT allele中(图五)。当然,这些结果也在KTC-1细胞系中得到重复验证。

总之,ChIp和荧光素酶实验都证明9q22位点中存在多种基因间远程增强子和一些SNPs可以影响这些enhancers的内在活性。


5


EnhancersFOXE1 PTCSC2的启动子之间的物理作用

考虑到以前研究发现GWAS SNP 影响FOXE1 PTCSC2的表达,该团队猜测上面观察到的enhancers可能直接通过与FOXE1 PTCSC2启动子的相互作用,从而调节这两个基因的表达。

  于是,他们利用染色体构象俘获技术(chromosome conformation capture3C),在KTC-1细胞系中研究enhancers和启动子之间的物理作用。他们评估相互作用的片段是~33 kb LD 区域以及基因FOXE1 PTCSC2的上游区域(图六)。Enhancers 1-3分别位于3C片段4-6。当3C实验中使用片段6上的常规引物和探针时,他们观察到片段619有很强的相互作用,而片段19非常靠近FOXE1上游(图六),同时又是位于PTCSC2转录亚型cintron 1内。片段619之间的线性距离约为51 kb,这说明这段区域可能形成long-range loop。当使用位于片段19 中的常规引物和探针时,他们观察到片段196的作用最强(图六)。这些结果说明9q22中的enhancers 可能与FOXE1 PTCSC2的启动子区域形成环状的相互作用,从而调节这两个基因的表达。

总之,该团队的研究为GWAS SNP rs965513作为PTC的有害因素,提供了新的功能注释。另外,他们还发现了多个功能性SNPs位于多种远程增强子元件上,并且证明这些SNPs有助于解释GWAS SNP所显示的疾病易感性。


好了,好了,洋洋洒洒,小编已经讲完了这篇文章的来龙去脉,希望大家能够学习到点东西哈。如果有什么不了解的,可以加入生信草堂交流群,一起讨论哈。(加群方式请见页首说明)