专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
生物学霸  ·  Mol ... ·  3 天前  
BioArt  ·  Genome ... ·  3 天前  
BioArt  ·  Nat Struct Mol ... ·  5 天前  
51好读  ›  专栏  ›  生信人

疾病最近研究的标杆产品,冲击二区神器

生信人  · 公众号  · 生物  · 2024-12-23 07:00

正文

这个思路很火,担心大家文章读起来有困难,我们特意录制了一个公开课,感兴趣的可以看下视频,增加下理解。

小伙伴们注意啦!全基因组关联研究(GWAS)和海量组学数据的大爆发,让孟德尔随机化(MR)在医学领域火得一塌糊涂。最近这篇发表在Nature Communications(IF=16.6)上的文章,为孟德尔随机化的应用又添新技。文章标题为:Integrating genetic regulation and single-cell expression with GWAS prioritizes causal genes and cell types for glaucoma,本文逻辑严密、思路清晰,提醒大家告别繁琐实验,纯生信也能冲高分~

疾病GWAS+MR方案

设计定制

扫码领取

文章简介:

原发性开角型青光眼(Primary open-angle glaucoma, POAG),是导致永久性失明的关键因素。高眼压(intraocular pressure, IOP)是POAG的主要危险因素之一,但有些患者即使眼内压正常也可能出现视力损失,因此,本研究探讨POAG中其他因素与视神经损害之间的关系。


具体思路:

1. 利用POAG和IOP的GWAS数据,识别出关联遗传位点;

2. 结合GTEx项目的eQTL和sQTL数据,对潜在的因果基因进行优先排序;

3. 通过eCAVIAR和enloc进行共定位分析,识别因果基因和调控机制;

4. 运用MR方法来支持eQTLs、s0TLs与疾病之间的因果联系;

5. 使用ECLIPSER方法分析单细胞RNA测序数据,识别特定细胞类型中的疾病相关基因;

6. 使用基因集富集分析揭示疾病相关的生物学过程和通路

通过一系列综合分析方法,本研究发现了一些这项研究提出了可能导致 POAG 发病的 IOP 依赖性和独立调控机制、基因、生物学通路和细胞类型。


结果解析:

1.在eQTL和sQTL中富集POAG和IOP的关联

为了探究eQTLs和sQTLs与POAG风险及IOP变异之间的关联性,研究人员采用QTLEnrich工具对49个GTEx(v8)组织的cis-eQTLs和cis-sQTLs进行了检验,探究这些e/sQTLs是否富集在POAG或IOP的相关标记中(全基因组关联研究P值小于0.05)。


在控制了混杂因素和组织样本大小后,作者发现大多数组织中的eQTLs和sQTLs与POAG和IOP的关联标记呈现出显著的富集现象(图1a;图2a、b)。进一步的观察发现,许多富集度最高的GTEx组织含有可能是青光眼致病的细胞类型。

通过调整后的富集度和估计的真阳性率,研究发现sQTLs对POAG和IOP的影响比eQTLs更为显著,这一现象在其他复杂性状中也有所体现。此外,对POAG和IOP有潜在贡献的eQTLs的数量(平均每个组织258至606个)是sQTLs(平均每个组织124至320个)的两倍,这可能归因于eQTLs的发现率高于sQTLs。


最后,具有排名最高的POAG或IOPGWASp值(P<0.05)的eQTL或sQTL的靶基因富集在代谢和细胞过程中。

图1a

 图2a、b

2. POAG 和 IOP 的GWAS 基因位点与cis-e/sQTLs 的共定位分析

在这一部分,作者利用49个GTEx组织的e/sQTLs和视网膜eQTLs,提出了可能解释这些性状全基因组显著位点的潜在因果基因。


作者对来自大型跨种族GWAS荟萃分析的127个POAG位点、欧洲子集分析的68个POAG位点(POAG EUR)以及主要欧洲GWAS荟萃分析的133个IOP位点应用了两种共定位方法,eCAVIAR和enloc,针对每个GWAS位点的LD区间内的e/sQTLs(图1b)。


作者在胫神经、脂肪组织、皮肤、动脉和成纤维细胞等组织中发现了最多的共定位e/sGenes,其中许多包含与青光眼病理性相关的细胞类型。并且,18个视网膜eQTLs与13个POAG和/或IOP位点共定位。每个组织的显著共定位e/sGenes数量与组织样本大小显著相关,表明e/sQTL发现能力是共定位e/sQTLs的组织特性的驱动力。

 

图1b

在这一步作者还发现,在基于eCAVIAR和/或enloc的所有GWAS检测基因位点中,58%的基因位点与至少一个eQTL和/或sQTL显著共定位(图2c)。约55%和29%的GWAS基因座分别与≥1个eQTL和≥1个sQTL共定位。

 
图2c

21%的POAG和IOPGWAS基因位点(共69个位点)中,发现同一e/s基因与eCAVIAR和enloc有显著的共定位(表1)。

表1


GWAS-e/sQTL共定位分析大大减少了POAG和IOP的每个GWAS基因座的推定因果基因数量:eQTLs和sQTLs平均每个位点分别提名了3个和2个因果基因,共定位的eQTLs和sQTLs之间的目标基因有部分重叠(图2e)。每个性状的共定位e/s基因中有60-72%是蛋白质编码基因,18-20%是非编码RNA基因,其中一半是lincRNA,一半是反义基因(图2f)。

图2e、f

3. POAG和IOP GWAS top基因位点的e/s基因定位以及对疾病风险的调控作用方向

除了优先确定可能导致 POAG 和 IOP 的因果基因和调控机制外,共定位 e/sQTL 还发现了基因表达或剪接改变对疾病风险或性状变异的影响方向(图 3)。

图3


在这里我们可用如下例子去理解:作用于TMCO1的eQTL和sQTL以及作用于TMCO1的反义RP11-466F5.8,方向相反的eQTL与POAG的第二强关联和最高眼压相关性(图4a-e)。这里存在推测:TMCO1表达减少和RP11-466F5.8表达增加会导致眼压水平升高和POAG风险增加。

图 4a-e

此外,在 GTEx 细胞-培养的成纤维细胞中,TMCO1 mRNA 的第一个外显子第 4 号外显子上有一个替代剪接供体位点,导致第 4 号外显子变长(图 4f,g),这与 POAG 风险降低有关。
 图 4f,g


4. POAG 和 IOP 共同和不同基因座的共定位基因

在 50 个重叠的 POAG 和 IOP GWAS 基因座中,有 39 个(78%)基因座对两个性状都有至少一个显著的共定位结果( 1)。

表 1


此外作者还发现,视网膜Hi-C环(6个位点)、CRE(16个位点)和/或SE(5个位点)支持≥1个共定位e/sQTLs作为潜在的因果机制。这包括在POAG交叉种群(rs944801OR=1.26)和POAGEUR(rs6475604OR=1.3)GWAS元分析中最强的正常张力青光眼(NTG)关联(9p21),它与大脑皮层中的CDKN2AeQTL、垂体中的CDKN2B-AS1和RP11-149I2.4sQTL以及骨骼肌中的CDKN2BeQTL共同定位。该位点的POAG风险变异和共定位e/sQTL与视网膜CRE重叠(图5a)。

图 5a

e/sQTL 结果表明,CDKN2A 表达增加、CDKN2B 表达减少以及 CDKN2B-AS1 的外显子跳越可能会增加 POAG 风险(图 3)。
图 3

其他位点还存在涉及视网膜 SLC2A12 eQTL 与视网膜 CRE 重叠,以及作用于 RERE 及其反义 RERE-AS1 的 e/sQTL 的情况( 5b、c),这些 e/sQTL 通过视网膜染色质环路与 RERE 转录起始位点(TSS)物理连接

图 5b、c


5.MR方法对e/sQTLs共定位

为了进一步支持e/sQTL与POAG和/或IOP之间的因果关系,作者使用欧洲POAG和IOPGWAS汇总统计数据,对基于eCAVIAR和/或enloc的所有显著共定位e/sQTL和GWAS基因座进行了双样本MR分析。


最终348个(75%)基因找到了因果关系的支持性证据(FDR<0.05),这些基因对水平多效性的影响是稳健的,可以进行多效性稳健灵敏度分析(1)。
表1


作者发现239个e/s基因与POAG和IOP都有显著的MR关联,其中包括TMCO1、GAS7、LMX1B、DGKG和NPC2(它们的视网膜eQTL与POAG和IOP共定位)。68个基因(如HLA-B和SLC7A6)与IOP有显著的MR关联,但与POAG无关;41个基因(如CDKN2B-AS1、RERE和YAP1)与POAG有显著的MR关联,但与IOP无关(图5)

 
图5


6.POAG和IOP共定位e/s基因在生物学过程中的富集情况 

为了从生物学角度了解相关基因可能对青光眼发病机制的贡献,作者接下来使用GeneEnrich(图1c)检测了所有与POAG、POAGEUR或IOPGWAS基因座共定位的e/sQTL的靶基因是否在特定的生物学通路、基因本体或小鼠表型本体中富集。最终发现,与POAG交叉基因座共定位的基因在弹性纤维形成和细胞外基质组织方面显著富集,在转化生长因子beta(TGF)受体信号通路和眼球形态异常等方面名义上富集(P<0.05)。与POAGEUR基因座共定位的基因在细胞衰老和细胞周期过程、脂质相关过程以及视网膜或神经元相关过程明显富集。

 图1c


7. 确定 POAG 和相关眼部特征的致病细胞类型

为了将涉及的基因与致病机制和细胞类型进一步关联,作者接下来测试了POAG或IOP共定位的e/sGenes在关键眼组织中特定细胞类型的表达是否富集,这些眼组织与POAG的病理生理学有关。首先,作者ECLIPSER应用于228、118和279个与POAG跨种族、POAGEUR和IOPGWAS位点共定位的e/sGenes,以及来自非病变人类眼球解剖的13种组织的单核(sn)RNA-seq的细胞类型特异性表达:中央角膜、角膜巩膜楔形区(CSW)、小梁网(TM)包括Schlemm管、虹膜、睫状体(CB)、晶状体(均来自前段),周边和黄斑视网膜、视神经乳头(ONH)、视神经(ON)、围视神经巩膜(PPS)、周边巩膜和脉络膜(均来自后段)(表2)

表2


在前段,作者发现POAGEUR位点在来源于睫状肌的成纤维细胞中显著富集(图6a,b)。睫状肌和虹膜是参与非传统外流通路的关键组织。这些成纤维细胞也在组织学上被发现在TM中,这三种组织在虹膜角膜角处相遇并交织,这也暗示了传统的房水外流通路。推动POAGEUR富集信号的e/sGenes在睫状成纤维细胞中的富集,也包含在富集于睫状成纤维细胞的POAG跨种族基因中(6c)。

图6a、b、c


POAGEUR基因在主要来源于TM组织的成纤维细胞中也有适度富集(被注释为TM成纤维细胞)。对于POAG跨种族和IOP位点,作者在外流通路和角膜成纤维细胞、血管内皮细胞以及晶状体上皮细胞中发现支持性的富集(图6a、d和7a)。与IOP位点共定位的基因在周围细胞(定位于CSW的cluster236)中也显著富集(FDR<0.1),并在淋巴管内皮和Schlemm管中有名义上的富集,其功能障碍可能导致IOP升高49(图7a)。根据驱动细胞类型富集的基因重叠,分别对POAG和IOP的前段细胞类型进行聚类(P<0.05),表明影响POAG的三类细胞-成纤维细胞、血管内皮和晶状体上皮。以及影响IOP的三类细胞-成纤维细胞、周围细胞和淋巴管内皮细胞(图6e和7b)。

图6d、e

图7a

在外流通路成纤维细胞类型中,驱动POAG富集信号的基因有45-78%在不同成纤维细胞之间共有(图6e),这表明在传统和非传统外流通路中既有共享的也有独特的基因作用。在周围细胞中驱动IOP富集信号的IOP基因(图7c、d)与在血管和成纤维细胞类型中富集的基因有很大不同(图7b)。另一方面,在TM成纤维细胞中驱动富集的IOP基因与在睫状和虹膜成纤维细胞中富集的IOP基因高度共享(图7b)。值得注意的是,IOP基因在周围细胞中的富集是对IOP特异的(图7c中)。

图7b、c

研究接着测试了视网膜单核RNA测序数据中POAG和IOP共定位e/s基因的富集情况。发现在星形胶质细胞和Müller胶质细胞中,跨种族POAG基因显著富集(图8a),并在另一项黄斑区的单核RNA测序研究中得到了复制。最后测试了视神经头(ONH)、视神经(ON)和相邻后部组织中细胞类型特异性富集情况。在围绕ONH的视乳头巩膜(PPS)中的成纤维细胞中发现跨种族POAG基因最强烈的富集(FDR < 0.01),其次是脉络膜中最丰富的成纤维细胞、位于ONH和ON的星形胶质细胞、脉络膜和PPS中的施万细胞、ON和ONH中的少突胶质细胞前体细胞(OPCs)和少突胶质细胞,以及主要在脉络膜中的血管内皮细胞(图8b, c)。POAG EUR基因显示出类似的富集模式(图8b)。

图8a-d

ONH(图8d,e)和来自不同捐赠者的视网膜样本中,推动星形胶质细胞富集的基因约有一半是相同的。DGKG,即二酰甘油激酶γ,其视网膜特异性eQTL与跨种族POAG关联共定位(CLPP=0.96;图8f),在ONH(图8d)和视网膜中显示出最强的星形胶质细胞特异性。IOP基因在主要位于脉络膜的血管内皮细胞和成纤维细胞中最显著富集,但也在ONH和PPS中富集,其次是脉络膜和PPS中的施万细胞、PPS和巩膜中的血管平滑肌细胞、ONH、PPS和脉络膜中的周细胞(26-ACTA2)、ON中的OPCs(FDR<0.06;图8b)。

图8e、f

全文总结:

本项研究综合运用了GWAS、eQTLs和sQTLs数据,以及单细胞RNA测序技术,对导致POAG和IOP的遗传因素进行了详尽的探讨。研究小组采用共定位分析的手段,识别出了与该疾病相关联的因果基因,并借助MR策略对这些基因的因果逻辑进行了进一步确认。此外,通过应用ECLIPSER分析工具,研究揭示了特定细胞类型在疾病发展过程中的关键作用,特别指出视网膜星形胶质细胞和Müller胶质细胞中聚集的与POAG相关的基因,以及血管内皮细胞和周细胞中富集的与IOP相关联的基因。这些研究成果不仅为理解青光眼的分子层面和细胞层面的机制提供了新的视角,也未来针对该病症治疗方式的制定贡献了关键的分子靶标。本文发在NatureCommunications(IF=16.6)上,全文很长,但思路清晰、逻辑严密,具备极强的学习优势和复现价值。