2024年12月17日,Nature Reviews Drug Discovery上发表了题为Open Targets: 10 years of partnership in target discovery的文章,重点阐述了
Open Targets在
学术界和业界科学家合作取得的主要成就和见解。
众多候选药物在临床试验阶段往往以失败告终,原因在于临床试验是对治疗手段安全性与有效性的严苛检验过程。而这些失败无疑增加了为患者提供新疗法的成本。其根源在于我们对药物靶点与疾病关联的认知尚不完善,以及预测靶点调节对疾病影响的能力存在局限。
研究表明,
有基因证据支持的药物靶点在药物开发中的成功概率更高
,这是解决这一问题的潜在方法之一。
Open Targets
成立于2014年,
旨在利用遗传学和功能基因组学的见解,改变靶点识别和优先排序。
业界与学术界科学家携手共同制定了
Open Targets
研究计划,截至目前,已批准95个项目。
该联盟的创始合作伙伴包括英国威康桑格研究所(Wellcome Sanger Institute)、欧洲分子生物学实验室下属的欧洲生物信息学研究所(EMBL-EBI)以及制药巨头葛兰素史克(GlaxoSmithKline)。
其最新成员则有基因泰克(Genentech)、默沙东(MSD)、辉瑞(Pfizer)和赛诺菲(Sanofi)。
在
Open Targets
的发展历程中,渤健(Biogen)、武田(Takeda)和新基公司(Celgene,现隶属于百时美施贵宝BMS)等企业也曾是联盟的合作伙伴。
联盟的研究成果在正式发表前,会先在合作伙伴间共享,随后才向公共领域开放 。
药物靶点识别是一个复杂的问题。要了解疾病生物学,必须整合多种证据类型,而我们的知识还存在许多空白。
Open Targets
研究计划采用系统的方法来解决两个首要但又相互关联的主题:
第一,生成将靶点与疾病联系起来的新数据;第二,将新的和现有的疾病关联证据整合到一个中央信息框架中
。
Open Targets
最初举办了行业与学术研讨会,旨在深入了解靶点发现过程中所面临的关键问题,以及解决这些问题所需的各类证据。研讨重点聚焦于整合遗传学、基因组学及其他相关证据,从而对靶点与疾病的关联性展开系统性评估。
现在,研究计划的核心主题是通过所有学术界和产业界合作伙伴之间的积极讨论建立起来的。项目在共同感兴趣的治疗和技术领域内开发,并在整个项目生命周期内合作开展。在确立研究项目时,
先会向学术界和产业界征集表达兴趣的意向书,随后在具有相关兴趣的团体间展开讨论,共同拟定项目建议书,以供集体审议。每一轮新项目的孕育,均以合作伙伴的兴趣偏好、专业知识,以及从现有项目中总结的经验教训为基石。
O
pen Targets项目系统地生成因果数据,将基因与疾病联系起来,或建立对疾病过程的基本认识。早期项目利用威康-桑格研究所的专业知识和先进技术(如CRISPR基因扰乱和单细胞转录组学)大规模生成新数据。
例如,早期的一个项目对324个癌症细胞系开展了全基因组CRISPR基因敲除筛选工作。由此产生的数据集,为将DNA解旋酶WRN确定为微卫星不稳定结直肠癌的靶点提供了因果性证据。另一个早期项目借助单细胞转录组学技术,绘制出哮喘患者及处于缓解期患者的气道与肺组织图谱,进而创建了基础研究资源。
以新数据生成为核心的项目,围绕联盟合作伙伴共同关注的治疗领域有序开展,包括肿瘤学、免疫学以及神经退行性疾病领域。这一聚焦方向使得各项目之间能够相互学习借鉴、共享资源,并采取统一的研究方法(例如,各项目均采用相同的诱导多能干细胞系背景)。此外,还有利于对多个项目的成果进行综合分析。
在人类细胞疾病模型中,针对因果性靶点与疾病关联的研究,已拓展至更为复杂的疾病相关试验。举例而言,这些试验深入探究了免疫细胞与癌细胞共培养所产生的影响、多种免疫细胞表型在免疫性疾病和神经退行性疾病中发挥的作用,以及神经元功能和细胞应激反应等多个方面的内容。
随着新兴技术的不断涌现以及扰动技术手段的日益丰富,最新开展的项目致力于将癌症领域的系统组合筛选技术,或在更为复杂系统中应用的碱基编辑技术,与单细胞层面的读数分析相结合,从而为精准治疗提供假设依据。
Open Targets最近开展的基础研究越来越注重从患者那里获得见解,以帮助将研究结果转化为药物开发决策。炎症性肠病(IBD)和系统性红斑狼疮项目使用单细胞方法绘制详细的疾病组织图谱,并生成细胞特异性定量性状位点图谱,以解构细胞分辨率的遗传影响。一个非小细胞肺癌项目利用单细胞和空间技术绘制疾病组织图谱,另一个代谢功能障碍相关性脂肪性肝炎项目则研究疾病进展,这两个项目都在需求尚未得到满足的疾病中生成了基础数据集。
利用MASLD进展的snRNA-seq分析胆管细胞和肝细胞的可塑性
用于评估靶点-疾病关联的数据集最初是在全球公共数据库(如EMBL-EBI的ChEMBL和UniProt)中发现的。
为了将不同资源中的性状和疾病术语进行映射,进而将相关证据整合到一个统一框架之中,我们需要一种本体论,即对疾病、表型及其相互关系进行规范描述的受控词汇表。通过与欧洲分子生物学实验室下属的欧洲生物信息学研究所(EMBL-EBI)的样本、表型和本体团队紧密协作,我们选定了实验因子本体(Experimental Factor Ontology)。这是因为该本体能够灵活地收纳各类术语,并实现与其他本体的映射。在此基础上,我们创建了一个全新的信息资源库,用于整合各类不同数据类型的证据,并对其进行量化评分。如此一来,便能在高质量的用户交互界面——
Open Targets
平台上,依据所整合的证据,对靶点与疾病的关联性进行系统性评估。
新的信息项目依托支持
Open Targets
平台的初始数据管道构建而成,而这些数据管道在初期运行时,需要高度的人工监督。随着研究的推进,工作流程得到了优化与自动化升级,同时借助更为复杂的实体识别技术、针对性的整理工作以及机器学习(ML)算法的应用,不仅扩大了数据覆盖范围,还提升了知识提取效率。
Open Targets的核心工作之一,便是采用系统方法对常见性状和疾病的遗传证据展开分析。
这一方法得到了众多研究的有力支撑,这些研究充分证实了人类遗传证据在药物发现成功率方面的重要影响。通过与美国国立人类基因组研究所-欧洲生物信息学研究所(NHGRI-EBI)的人类全基因组关联研究目录(GWAS目录)开展合作项目,
Open Targets
及其所在的科研社区得以获取GWAS的完整汇总统计数据。基于此,
Open Targets
随后创建了一项新的核心资源——
Open Targets Genetics,旨在应对大规模为GWAS基因座精准分配因果基因这一艰巨挑战
。
Open Targets平台
的配套资源,为证明疾病相关基因位点与候选因果变异之间的关系提供了海量遗传学证据,进而助力预测药物靶基因。
Open Targets
平台所提供的开源资源,已被积极探索靶点与疾病关联的学术界和产业界广泛采用。目前,联盟正全力投入Open Targets Genetics数据管线的重新开发工作,以期为Open Targets信息学生态系统的未来迭代版本提供强劲动力,同时深度应用ML技术,开创与数据交互及从数据中进行预测的全新模式 。
Open Targets的创立与成功发展,充分彰显了多个商业实体与学术界之间在竞争前开展的卓有成效的合作模式,为其他领域树立了可供借鉴的典范。