专栏名称: 23Plus
23Plus是首个专注于表观遗传学领域的网络社区平台,汇聚全球表观遗传领域专家、学者以及医疗实践者,致力于打造兼专业与科普为一体的的表观遗传互动阵地。
目录
相关文章推荐
生信宝典  ·  第二轮会议通知 | ... ·  昨天  
生物制品圈  ·  卡介苗免疫疗法治疗膀胱癌研究进展 ·  3 天前  
生物学霸  ·  大家都用 Deepseek ... ·  2 天前  
生信宝典  ·  iMeta | ... ·  3 天前  
51好读  ›  专栏  ›  23Plus

Plus深读 | Nat. Genet. 揭示具有增强子功能的启动子---Epromoter

23Plus  · 公众号  · 生物  · 2018-01-24 07:00

正文


原文链接:

https://www.nature.com/articles/ng.3884

在基因组上,基因的表达受到近端的启动子和远端的增强子共同调控。近年来,一些研究发现部分启动子可能具有增强子活性。为了在全基因组鉴别有增强子功能的启动子,来自法国Aix-Marseille大学的Salvatore Spicuglia课题组,利用体外报告系统筛选,结合体内CRISPR-Cas9,在小鼠和人类细胞中筛选鉴定出了一系列具有增强子功能的启动子,它们可激活远端的基因。该工作揭示了基因组上精细的转录调控过程,将有助于我们理解机体发育与疾病发生发展过程。


一、  在小鼠细胞中发现部分启动子有增强子活性


为鉴定出基因组上的增强子序列,Salvatore Spicuglia课题组此前开发了一项体外报告系统,叫做CapStarr-seq (Captured self-transcribing active regulatory region sequencing) [1, 2] ,如图1所示 [3, 4]

图 1 CapStarr-seq流程图


CapStarr-seq流程如下:

  1. 研究者将基因组打断(本文用DNase I酶切基因组DNA,富集出的DNA即为染色质开放程度较高的DNA,即DHS,DNase I hypersensitivity sites);

  2. 合成< 150bp 的DNA 探针,用DNA microarray的方法,把打断的基因组杂交出来,作为待鉴定的增强子(图1a前两步);

  3. 构建报告质粒:利用增强子无论在基因的上游还是下游,均可激活靶基因转录的特性,将待鉴定的增强子放在报告基因的3’端,和报告基因GFP融合在一起(图1a第三步,图1b)。将质粒转染目的细胞。

  4. 用流式细胞术分选出GFP高表达的细胞,进行RNA-seq。同时检测转染到细胞内的待鉴定增强子的DNA量。

  5. 报告质粒会转录出GFP融合待鉴定增强子的RNA(图1C)。通过RNA-seq可以获知融合RNA的序列及丰度,将该丰度除以转染的DNA量,即可得知待鉴定的增强子是否具有增强子活性,是否可激活GFP表达,及其活性。

该方法的优点是: 可以大规模筛选、鉴定基因组中的增强子;用探针杂交的方法捕获待鉴定的增强子序列,节省了合成DNA的成本;待鉴定的增强子序列可以通过RNA-seq测到,因此不需要额外给每个增强子序列设计标签序列,节省人力物力。缺点是无法考虑体内染色质环境的影响。而且融合表达的增强子序列可能会影响RNA稳定性。

增强子研究的更多方法,欢迎点击: Plus深读 | Nature Biotech: 如何研究基因组中的非编码序列?

在本文中,研究者将小鼠T细胞系P5424的基因组切断,捕获DHS序列,分为两类:启动子近端序列(距离TSS < 1kb)和远端序列(距离TSS > 1kb)。构建报告质粒,转染小鼠T细胞系P5424和小鼠胚胎成纤维细胞系NIH-3T3,进行RNA-seq,比较来自T细胞系的两类DHS序列,在两种不同细胞内的增强子活性。

研究发现, 具有增强子活性的远端DHS序列具有更强的组织特异性, 而近端序列的组织特异性较弱。这体现在:来自T细胞的远端增强子上富集淋巴转录因子的结合(如ETS1,HEB),而近端序列则缺少这些转录因子的结合(图2a);来自T细胞的远端序列更多地只在T细胞中具有增强子活性、在胚胎成纤维细胞中无增强子活性,而近端序列则更多地在两种细胞系中都有增强子活性(图2b-2d)。

图 2 具有增强子活性的远端DHS序列具有更强的组织特异性 | ( a )T细胞中的淋巴转录因子的ChIP-seq表明它们更富集在具有增强子活性的远端DHS序列上。( b ) 棕色部分是在两种细胞系中都有增强子活性的DHS,其中近端DHS的棕色比例高于远端DHS。( c,d ) 表明来自T细胞的DHS序列转入胚胎成纤维细胞后的增强子活性,仍然是远端序列弱于近端序列,表明远端序列的组织特异性更强。

研究还发现,具备增强子活性的近端DHS序列大多分布在TSS上游300bp至下游100bp,基本与核心启动子区重叠。因此,研究者把这些具备增强子活性的启动子称为Epromoter。下面,研究者将用该方法鉴定人源细胞K562和HeLa中的Epromoters,并研究其特征和功能。


二、在人源细胞中鉴定具有增强子活性的启动子


研究者在ENCODE计划所用细胞系:人类髓性白血病细胞系K562和人类宫颈癌细胞系HeLa中筛选鉴定Epromoters。

他们将K562和HeLa细胞的基因组打断,捕获TSS -200bp至+50bp的DNA序列,进行CapStarr-seq。最终,他们在20719个启动子中,筛选到632个K562的Epromoters,以及493个HeLa的Epromoters,两者交集为146个。这些Epromoters与对照组启动子(基因有相同转录活性、非Epromoters的启动子)相比,CpG岛的比例无明显差别,物种间保守性也无明显差别。


三、 Epromoter的表观基因组学和基因组学特征分析


研究者针对Epromoter的表观基因组进行分析,发现Epromoter有更高的p300(H3K27ac乙酰化酶)结合水平(图3a),更高的H3K4me1和H3K27ac水平(图3b), 具备增强子的表观遗传学特征 。并且来自K562的Epromoter序列转染K562细胞的增强子活性要强于转染HeLa细胞,HeLa Epromoter也是转染HeLa更强(图3c),说明Epromoter还是具有一定的组织特异性的。

图 3(上)Epromoter具备增强子的表观遗传学特征

在HeLa中进行5’GRO-seq发现Epromoter有更高比例的反向转录(divergent transcription),这也是活跃的增强子的一个特征。

针对Epromoter近端基因进行GO聚类分析(图3d),发现其首先富集在一些基本生命过程相关的基因上(如肌动蛋白微丝相关基因,细胞代谢过程)。这和此前在果蝇的Starr-seq的结论相符, 一些持家基因的启动子可发挥增强子功能。 此外,K562和HeLa的Epromoter的富集通路也有 各自的独特性 。K562的Epromoter特异地富集在应激相关基因上,而HeLa的Epromoter特异地富集在I型和II型干扰素应答基因、病毒相关基因、病毒防御基因上。HeLa细胞确实高表达很多干扰素应答基因,而K562并没有,这可能是因为HeLa细胞来源于乳头瘤病毒感染的肿瘤细胞。此外,Epromoter还富集很多转录因子的motif(图3e),这也和增强子类似。

图 3(下)Epromoter具备增强子的表观遗传学特征 | (d) K562和HeLa的Epromoter近端基因的聚类分析。(e) K562和HeLa的Epromoter上富集的转录因子motif。


下面,研究者发现Epromoter近端基因的转录活性并不比非Epromoter更高(图4a); K562或HeLa特异性的Epromoter近端基因的转录活性,在两种细胞系中也差不多(图4b),这表明Epromoter可能并不是近端基因的增强子。通过Pol II、H3K4me3、RAD21 ChIA-PET发现,Epromoter比非Epromoter在远端基因有更强的启动子-启动子相互作用(图4c)。这提示Epromoter是远端基因的增强子。


图 4 Epromoter的近端基因表达情况,以及启动子-启动子相互作用。


四、 在体内验证Epromoter是真实的增强子


研究者以FAF2基因的Epromoter为例进行研究。他们用Pol II ChIA-PET发现该Epromoter与基因NOP16, CLTB 和RNF44的启动子有相互作用(图5a)。为了研究该Epromoter在体内是不是增强子,他们用CRISPR-cas9将该Epromoter切除,发现NOP16在Hela中的表达下降,RNF44在Hela及K562中的表达都下降(图5b)。这提示FAF2 Epromoter可能是RNF44的增强子。切除FAF2基因的Epromoter后,RNF44启动子的H3K27ac水平下降(图5c)。4C-seq也发现WT细胞的FAF2基因的Epromoter与RNF44启动子有互作,但切除Epromoter后互作消失(图5d)。最后,研究者又构建了体外luciferase报告系统,证明该Epromoter可以激活RNF44的启动子(图5e)。而如果切除RNF44的启动子,FAF2的表达不受影响(图5f),表明FAF2 Epromoter对RNF44的调控作用是单向的。


这些结果证明了FAF2基因的Epromoter是距其88kb处的RNF44基因的增强子。

图 5 FAF2基因的Epromoter是距其88kb处的RNF44基因的增强子


那么该Epromoter作为增强子时,有没有方向呢?为了解答这一问题,研究者将FAF2的Epromoter在基因组上翻转了过来,发现翻转后,RNF44的表达会下降(图6a),但还是高于Epromoter切除后的表达量(图6b)。这说明该Epromoter有一定方向性。


此外,过表达FAF2无法回复由于Epromoter切除或翻转引起的RNF44下调(图6b),证明RNF44并不是受FAF2基因调控的。

图 6 FAF2 Epromoter有一定的方向性


五、 Epromoter可调控远端的干扰素响应基因


研究者利用ChIA-PET寻找Epromoter的靶基因(图7a),找到K562和HeLa的Epromoter的远端靶基因中,分别有18个和56个是干扰素调控基因(图7b)。

例如在K562中,SERPING1基因的Epromoter的远端靶基因是干扰素响应基因UBE2L6,METTL21A的远端靶基因是干扰素响应基因CCNYL1。这些干扰素响应基因在TNF-alpha的刺激下会被激活。但如果切除对应的Epromoter,UBE2L6和CCNYL1就不能在TNF-alpha的刺激下激活(图7c, 7d)。

这进一步证明了Epromoter对远端基因有顺式调控作用。

图 7 Epromoter可调控远端的干扰素响应基因

最后,研究者发现SNP可以影响Epromoter的活性,当把K562细胞的Epromoter的SNP突变,会导致Epromoter的靶基因的表达下调(图8)。这提示Epromoter中的疾病相关的SNP可能影响远端的基因表达,可能有助于我们更好地研究疾病的发生发展机制,

图 8 把K562细胞的Epromoter的SNP突变,会导致Epromoter的靶基因的表达下调

延伸思考

1.本研究通过高通量报告系统筛选了小鼠和人类细胞中,可能具有增强子功能,激活远端基因表达的启动子,将其命名为Epromoter。研究者鉴定了这些Epromoter的独特的基因组学和表观遗传学特征,以及SNP对其产生的影响, 证明了部分启动子可以作为增强子,以及CapStarr-seq可以很好地用于筛选增强子。 本研究揭示了基因组上精细的转录调控过程,将有助于我们理解机体发育与疾病发生发展过程。

2.本研究提示, 启动子可能存在成簇激活的情况。 这或许有利于转录机器更高效地完成转录。但值得注意的是,成簇激活的启动子可能并非互相激活。本文发现F2F Epromoter可以调控RNF44,但反之则不行。说明它们之间还是存在dominance的。此外,Epromoter调控的近端与远端基因,或许功能上存在联系,使得他们经常需要被一起激活,同时 这种成簇激活还存在上下游关系 。后续工作可以对其生物学功能展开更多研究。

3. lncRNA的启动子也有可能发挥增强子的作用 。2016年,Eric Lander 和 Eric Olson分别在Nature上发表的两篇论文,及Mitchell Weiss在Molecular Cell 发表的论文,都分别提出了这一设想 [5-7] 。如lncRNA linc1536/Bendr的启动子可以调控35kb外的基因Bend4的转录,lncRNA Uph的启动子也可以调控Hand2的表达。以前研究lncRNA的作用,经常采用 删除lncRNA(或其promoter)的做法 。这样看到的表型,其实 并不一定对应lncRNA作为RNA的功能 ,还有可能是其作为调控元件的作用,或其转录过程对其他基因的调控作用。所以,或许可以采用 antisense-oligo(ASO) 在核内敲低lncRNA来进行研究。此外,还可以rescue lncRNA(通过质粒,或者整合到基因组的其他位置产生核内lnRNA)作为对照。

(更多内容欢迎点击: 【Plus深读】lncRNA:不只是RNA——三篇重磅文章齐解读

4.后期工作还可以研究Epromoter和远端启动子之间的 染色质高级结构如何被调控 ,与基因间区的经典增强子-启动子互作有何异同。

5.可以在DNA序列上分析Epromoter与基因间区的经典增强子的关系,推测增强子的起源机制(部分增强子也许源于启动子的复制、易位,Epromoter也许是比较原始的增强子模式)。

有关增强子的更多研究,可参考:

Plus深读 | Mol Cell: Mll3/4催化的H3K4me1对增强子活性不必要

Plus深读 | eRNA激活增强子的乙酰化?

【Plus深读】Nature Comm:原发性胃癌的超级增强子异质性分析


参考文献

[1] ARNOLD C D, GERLACH D, STELZER C, et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq[J]. Science, 2013,339(6123):1074-1077.

[2] VANHILLE L, GRIFFON A, MAQBOOL M A, et al. High-throughput and quantitative assessment of enhancer activity in mammals by CapStarr-seq[J]. Nat Commun, 2015,6:6905.

[3] DAO L, GALINDO-ALBARRAN A O, CASTRO-MONDRAGON J A, et al. Genome-wide characterization of mammalian promoters with distal enhancer functions[J]. Nat Genet, 2017,49(7):1073-1081.

[4] ELKON R, AGAMI R. Characterization of noncoding regulatory DNA in the human genome[J]. Nat Biotechnol, 2017,35(8):732-746.

[5] ENGREITZ J M, HAINES J E, PEREZ E M, et al. Local regulation of gene expression by lncRNA promoters, transcription and splicing[J]. Nature, 2016,539(7629):452-455.

[6] ANDERSON K M, ANDERSON D M, MCANALLY J R, et al. Transcription of the non-coding RNA upperhand controls Hand2 expression and heart development[J]. Nature, 2016,539(7629):433-436.

[7] PARALKAR V R, TABORDA C C, HUANG P, et al. Unlinking an lncRNA from Its Associated cis Element[J]. Mol Cell, 2016,62(1):104-110.








请到「今天看啥」查看全文