专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
BioArt  ·  六篇Cell Genomics | ... ·  5 天前  
生信菜鸟团  ·  中性粒细胞多重免疫荧光共标细胞计数 ·  1 周前  
生物学霸  ·  高福院士 2024 年连发 6 ... ·  1 周前  
BioArt  ·  Nat Immunol背靠背 | ... ·  1 周前  
51好读  ›  专栏  ›  生信人

轻松发NC,不要光想着MR,Post-GWAS这样做才是对的

生信人  · 公众号  · 生物  · 2024-10-13 06:57

正文

2024年9月发表在《Nature communications》(IF:14.7)的文章:“抑郁症和皮质下脑结构体积的共享遗传机制Investigating the shared genetic architecture between depression and subcortical volumes”。该研究的主要目的是识别抑郁症和皮质下体积的共享遗传基础。作者使用双变量因果混合模型(MiXeR)方法,揭示两者间多基因架构的重叠,并通过条件/联合错误发现率(cond/conjFDR)分析来识别两者间的共享基因位点。此外,研究还分析了这些共享基因的功能注释及其在不同发育阶段的表达模式,探索它们与认知能力和行为症状的关联。


添加微信

精彩推送不错过


一、背景

抑郁症是一种广泛存在且遗传性很高的精神健康问题,全球有数百万人受到其影响。神经影像学研究已经发现,与抑郁症相关的皮质下结构(如杏仁核和海马)存在体积异常,但其背后的遗传机制尚不明确。本研究探讨抑郁症与14种皮质下体积表型之间的多基因重叠,通过基于全基因组关联研究(GWAS)的数据,进一步揭示抑郁症与皮质下体积的共享遗传结构。


二、研究思路及相关数据下载和方法介绍

该文章的所有数据及方法均为公开访问;小编已为大家进行了整理与说明。


1.GWAS数据收集与处理:利用最大规模的抑郁症GWAS数据(N=674,452)和14种皮质下体积表型的GWAS数据(N=33,224),进行遗传关联分析。

抑郁症GWAS数据下载:https://ipsych.dk/en/research/downloads/ 注意:下载不含23andMe的GWAS汇总数据,包含23andMe样本的数据需要申请。

皮质下体积表型数据下载:https://open.win.ox.ac.uk/ukbiobank/big40/ 注意:该数据库还包含除皮质下体积外的其他UKB脑成像表型的GWAS数据。


2.多基因重叠评估:采用MiXeR方法评估抑郁症与皮质下体积的遗传重叠,计算两者间的遗传变异共享比例。MiXeR是一种用于研究多基因表型间共享遗传架构的统计模型。MiXeR 方法不仅考虑了GWAS中显著的基因变异,还综合考虑了所有基因变异对表型的影响,无论其效应方向是否一致。这使得MiXeR能够有效捕捉基因变异在两个表型中的重叠情况,尤其是在遗传变异对表型的影响方向不一致的情况下。

MiXeR下载:https://github.com/precimed/mixer 注意:该方法需要在Linux环境下运行,github主页有软件安装及环境部署教程,此外还有示例方便大家进行学习,后续若是需要小编可以为大家单独进行演示。


3.共享基因位点识别:利用pleioFDR软件通过cond/conjFDR分析,识别与抑郁症和皮质下体积相关的共享遗传位点,定位潜在的基因。PleioFDR,是一种用于识别两个或多个表型之间共享遗传位点的统计方法。PleioFDR是在GWAS数据的基础上,通过利用多个表型的关联信息来增加发现遗传变异的能力。其核心思想是通过比较两个表型的基因型-表型关联来识别这些表型的共享遗传变异,并调整错误发现率(FDR)以控制多次比较所产生的假阳性结果。


PleioFDR下载:https://github.com/precimed/pleiofdr 注意:该方法同样可以在Linux环境下运行,github主页有软件安装及环境部署教程,此外还有示例方便大家进行学习,后续若是需要小编可以为大家单独进行演示。


4.功能注释与基因映射:利用FUMA在线工具平台对共享基因进行功能注释,分析它们的发育表达轨迹,以及它们对抑郁症和皮质下体积的影响。

FUMA在线工具平台:https://fuma.ctglab.nl/ 该平台的使用相信各位生信人小伙伴应该不会陌生。


5.关联分析:通过基因表达与表型关联分析,研究共享基因与认知能力及行为症状的关联性。在这里作者使用了S-MultiXcan评估了抑郁-皮质下体积共享基因的表达与脑组织eqtl数据进行了组织特异性关联分析;进一步利用了8种认知能力相关表型的GWAS数据以及15种行为表型的GWAS数据与抑郁-皮质下体积共享基因进行了关联分析。


S-MultiXcan是一种基于汇总统计数据的多表型转录组关联研究方法。S-MultiXcan能够整合多种表型的GWAS数据与转录组数据,评估基因表达对多个表型的联合影响。它在传统的TWAS基础上扩展,允许同时分析多个表型,以识别在不同表型中共同作用的基因。


MultiXcan下载:https://github.com/hakyimlab/MetaXcan 注意:MetaXcan包换多个工具,能够将基因表达与复杂性状进行整合分析。S-MultiXcan是其中的SMultiXcan.py命令。这里小编推荐该软件同样在Linux环境下部署,其github主页有软件安装及环境部署教程。


6.遗传相关性分析:作者利用LDSC计算了抑郁症-皮质下体积的全基因遗传相关性;进一步使用LAVA计算了局部遗传相关性以验证conjFDR分析鉴定的共享基因座。

LDSC下载:https://github.com/bulik/ldsc 相信小伙伴们对于LDSC的使用并不陌生。

LAVA下载:https://github.com/josefin-werme/LAVA 注意:LAVA软件是在R语言条件下运行,需要利用remotes::install_github("josefin-werme/LAVA")进行下载,所以小伙伴们如果不能顺利安装记得设置github_token。


三、结果

1.抑郁症与皮质下体积的遗传重叠

使用MiXeR模型 来评估抑郁症与14种皮质下脑结构(如海马、杏仁核、尾状核等)在遗传变异上的共享程度。单变量MiXeR模型表明抑郁症的单核苷酸多态性(SNP)遗传力较低,为0.051,这意味着抑郁症较少的遗传变异可以通过目前的研究数据被解释。相比之下,所有皮质下结构的遗传力都更高,范围从0.181到0.295,表明这些结构的遗传特征更容易被发现 (图1a)。而抑郁症的基因多样性很高,约有9400个基因变异可能影响抑郁症,而皮质下结构则在939到3207个基因变异之间。高基因多样性表明这些表型受到多种基因的影响 (图1a)。进一步的双变量MiXeR模型表明,在14种皮质下脑结构中,有8种结构与抑郁症表现出显著的遗传重叠。具体而言,皮质下体积与抑郁症共享了23.4%到83.3%的遗传变异;而抑郁症与皮质下体积共享了4.1%到17.9%的遗传变异 (图1b)。此外,抑郁症和皮层下体积之间共享变异的等位基因效应表现出不同的方向,具有一致效应的共享变异比例从19.7%到73.6%不等 (图1c)。例如尾状核和壳核与抑郁症之间存在正向相关性 (尾状核:rho = 0.634),而海马与抑郁症呈现负相关性 (左海马:rho = -0.784)。

图1

2.共享遗传位点的鉴定

研究进一步通过condFDR分析,鉴定了94个与抑郁症相关的遗传位点,其中有7个是新的位点。这些新位点中的候选SNP被映射到14个基因上。由于基因数量较少,富集分析未发现显著结果。当针对皮质下体积进行condFDR分析时,识别出了233个与不同皮质下结构相关的遗传位点,其中有13个是新的位点。这些位点中的候选SNP被映射到57个基因,富集分析揭示了多个基因与GABA能中间神经元发育和嘧啶核苷生物合成过程等生物学过程相关。通过条件分位数-分位数 (Q-Q) 图,作者观察到了抑郁症和皮质下体积表型配对之间的显著遗传重叠。作者进一步利用conjFDR分析在77个遗传位点发现了抑郁症和皮质下结构体积的共享关,在这77个共享位点中,有51个基因组位点同时与抑郁症和至少两种皮质下体积表型相关联,进一步整合后得到了44个独特的共享遗传位点。这些位点在不同表型对中表现出一致的关联 (图2a-b)。在所有共享位点中,最显著的一个位点位于chr18:50358109-51055069 区域,该位点与抑郁症和双侧壳核体积显著关联。该位点的lead SNP为rs4632195,左侧壳核的conjFDR值为1.0E−8,右侧壳核的conjFDR值为4.3E−9 (图2c)。

图2

3.共享遗传位点的功能注释及基因表达的发育轨迹

作者通过conjFDR分析鉴定了44个共享的遗传位点,这些位点与抑郁症和皮质下体积均有显著关联。进一步的功能注释表明在44个共享位点中,约58.7%的SNP位于内含子区域,而25.4%的SNP位于非编码RNA内含子区域 (图3a)。此外,有少部分SNP为非同义突变,影响蛋白质的结构和功能,进一步解释了这些位点的生物学意义。这些位点映射了269个编码蛋白的基因。其中富集分析揭示,这些基因与神经元投射发育、轴突生成和中枢神经系统发育等过程密切相关,表明这些基因在脑结构和情绪调节中可能发挥关键作用 (图3b)。作者随后分析了共享基因在不同发育阶段中的表达轨迹,发现这些基因在不同皮质下结构中表现出特定的发育模式发育高峰期:与抑郁症和皮质下结构共享的基因在妊娠中期 (16-22周) 表现出高水平的基因表达,随后在出生后的早期 (0.5-2.6岁) 达到稳定水平 (图3c)。这些基因表达轨迹的不同表明,不同皮质下结构中的基因在生命早期的发育过程中扮演着不同的角色。研究发现,在抑郁症与皮质下结构的关联中,这些基因的表达模式在妊娠期和出生后早期的不同时间点达到峰值,提示这些时间窗口可能是影响大脑发育及其与精神疾病相关的关键时期。然后作者使用S-MultiXcan工具分析了与抑郁症和皮质下体积共享的基因在大脑中的表达情况,发现了137个显著的基因表达关联,这些关联涉及71个基因,并与多个皮质下体积表型相关。在这71个基因中,有55个基因也同时与抑郁症表现出显著关联 (图3d)。例如在所有基因中,CELSR3的表达与抑郁症的关联最为显著。该基因还与右侧苍白球体积有密切联系。CELSR3编码了一种与神经发育和神经元极化有关的蛋白质,可能参与了大脑中的神经元网络形成,这进一步表明它在调控情绪和神经功能方面的潜在作用。

图3

4.基因表达与认知、行为症状的关联

通过S-MultiXcan工具,作者进一步探讨了基因表达与认知能力和行为症状之间的关联,共有55个基因在基因表达中与抑郁症和皮质下体积表现出显著关联。而这些基因中的30个与认知能力和行为症状密切相关,特别是在反应时间、语言推理等认知领域 (图4a)。例如LRRC37A2、CRHR1和GPX1等基因不仅与多种皮质下结构体积相关,还与抑郁症的认知和情绪症状有强烈关联 (图4b-c)。

图4

四、总结

该文章重点研究了抑郁症和皮质下脑结构之间的共享遗传架构,探索了二者在基因层面的重叠性及其对脑结构体积的影响。通过对抑郁症和皮质下体积 (如海马、尾状核、壳核、苍白球、杏仁核、丘脑和伏隔核) 的GWAS数据进行跨基因组关联分析,文章采用了MiXeR和cond/conjFDR等方法来识别两者之间的共享遗传位点,揭示了其复杂的遗传关联。该文章的优势在于:①该研究利用了迄今为止规模最大的GWAS数据集,为研究抑郁症和皮质下脑结构之间的遗传重叠提供了强有力的统计效力;②文章不仅停留在基因关联分析层面,还通过PsychENCODE数据对共享基因的发育轨迹进行了深入分析,揭示了基因在不同发育阶段的表达模式;③对于共享基因,作者进一步将其与认知和行为的相关表型进行关联分析,强调了这些基因多维度影响对于抑郁症之外的表型;④使用了多种遗传统计方法,弥补了传统GWAS可能低估遗传重叠的不足。通过考虑基因效应的方向性,研究更全面地揭示了遗传变异的复杂性。总之该文章绝对可以作为Post-GWAS分析的一篇范例进行模仿,所有数据及方法均为公开访问可获得的,大家进行Post-GWAS分析不要只局限于MR,合理的累加方法绝对是锦上添花之举。



添加微信

精彩推送不错过


最新文章汇总(持续更新ing)


最新热点方向

1、这个科研方向已经不适合临床医生

2、Science:脊髓损伤后的神经再生重大突破

3、全网最全!哈佛生信女神刘小乐团队研究成果汇总

4、Cell Stem Cell最新综述:肿瘤干性的标志

5、Cell重磅:樊嘉院士、高强教授联合发表!中性粒细胞又有新状态了!


生信人课堂

1、多组学水平的孟德尔随机化分析套路

2、单细胞+空转王炸组合,探索骨骼肌纤维化巨噬细胞

3、以小博大,紧张刺激:肿瘤耐药研究,从基因到网络

4、零基础入门-单细胞课程

5、史上最全格局打开,细讲基因组学,确定不来学学?


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多