专栏名称: 测序中国
测序中国(seq.cn):基因行业新媒体
目录
相关文章推荐
新华社  ·  又破纪录!吒儿,继续冲! ·  11 小时前  
51好读  ›  专栏  ›  测序中国

Nature子刊发布新型分析框架Open Targets Genetics,助力揭示GWAS性状相关基因-疾病-表型关联

测序中国  · 公众号  ·  · 2021-12-05 10:11

正文

人类遗传学的一个主要目标是利用自然变异来了解改变基因组中每个蛋白质编码基因导致的表型影响。目前全基因组关联研究 (GWAS) 已确定超90%的GWAS性状相关SNP位于非编码区域,并通过调控机制影响邻近基因的表达。此外,对致病基因和细胞/组织作用位点的鉴定、将因果变异与其可能的因果基因关联等过程费时费力,不仅需要对单个位点进行详细的低通量分析,还要将GWAS数据与不同细胞类型、组织的多组学数据集进行整合。因此,急需一种全面、无偏见、可扩展和可重复的方法,可以通过所有公开可用的数据和知识,将基因系统地分配给整个表型和疾病范围内的已发表基因座。

近日,来自英国桑格研究所的研究团队联合欧洲分子生物实验室,整合了来自GWAS、eQTL、蛋白质数量性状基因座 (pQTL) 以及表观基因组学的数据, 开发出一种系统且全面的分析框架,能够对每个已发表的GWAS性状相关基因座的因果基因进行优先排序,实现疾病-疾病和疾病-分子性状共定位分析 。该研究成果发表于 Nature Genetics ,文章题为“An open approach to systematically prioritize causal variants and genes at all published human GWAS trait-associated loci”

文章发表在 Nature Genetics

研究团队整理了来自GWAS数据库和UK Biobank的数据,并将数据进行系统性地精细映射,在133,441个研究先导变异相关基因座中生成一组可信的因果变异。同时,研究人员还对3,621个GWAS数据集进行了跨特征共定位分析,并提供了汇总统计数据,方便大家识别具有共同遗传病因和机制的疾病。

接下来,为研究基因表达和蛋白质丰度的变化是否影响性状变异和疾病易感性,研究人员整合了92个不同组织和细胞类型特异性分子QTL (molQTL) 数据集(包括GTEx 、eQTLGen 、eQTL Catalog 和 pQTLs ),并进行了系统疾病-分子性状共定位测试。最终,研究人员使用 基于精细映射、共定位、功能基因组学数据和距离的机器学习框架来优先考虑所有性状相关基因座上可能的因果基因,成功开发出分析框架Open Targets Genetics( 图1)。

图1.Open Targets Genetics框架示意图。来源: Nature Genetics

研究人员使用优先基因对已知的批准药物靶点进行了富集(优势比 = 8.1,95% 置信区间= 5.7、11.5),科研工作者可以通过门户网站( http://genetics.opentargets.org )获得以上所有数据结果,对特定疾病相关位点的基因进行优先排序。此外, 使用Open Targets Genetics还可以发现基因、变异和性状之间的关联,了解与疾病相关基因作为药物潜在靶点的潜力 (图2)。

图2.Open Targets Genetics介绍页。来源:https://genetics.opentargets.org/

在Open Targets Genetics平台上,用户可以轻松找到 所研究基因与性状的关联、共定位关系,所有关联都有真实文章支持 (图3)。这样的排序依赖于研究团队开发的 新型机器学习模型“L2G”(Locus-to-gene),该机器学习模型已被证实具有良好的性能 。目前 ,L2G评分优先排序的顶级基因与已知的数据已全部关联,包括疾病-基因对与批准的药物以及新的疾病-药物靶标关联

图3.与PCSK9关联的表型和共定位信息。来源:https://genetics.opentargets.org/

此外,用户还可以 在Open Targets Genetics上找到与所研究基因关联的疾病和表型的信息 ,包括遗传关联、体细胞突变、用药、系统生物学、基因表达量和动物模型等信息(图4)。Open Targets Genetics为科研工作者提供了一个方便快捷的基因-性状关联研究平台。

图4.与PCSK9相关的疾病信息。来源:https://genetics.opentargets.org/


总结


研究团队开发了一个以相同方式格式化、协调并聚合人类特征、疾病GWAS、molQTL和功能基因组学数据的分析框架,为整个GWAS特征的目标优先级提供了统计证据和疾病信息; 研究团队还训练了一个机器学习模型“ L2G ”,该模型集成精细映射和功能基因组学数据,可以对可能的因果变异和基因进行优先排序 ,为发现潜在的新治疗靶点提供了可能。

· END ·

热文推荐


Nature Genetics | 基于8个国家人群队列全基因组测序数据绘制食管癌突变特征图谱

学术成果 | 多组学研究揭示磨玻璃肺结节惰性生长的分子特点

中科院计算所赵屹团队发表多组学数据融合深度学习框架——DeepOmix







请到「今天看啥」查看全文