摘要:
药物发现正在适应数据科学、信息学和人工智能(AI)等新技术,以加速有效治疗的开发,同时降低成本和动物实验。投资者、工业界和学术界的科学家以及立法者对人工智能的兴趣不断增加,表明人工智能正在改变药物发现。成功的药物发现需要优化与药效学、药代动力学和临床结果相关的属性。
本综述讨论了人工智能在药物发现的三大支柱中的应用:疾病、靶点和治疗方式,重点关注小分子药物。生成化学、机器学习和多属性优化等人工智能技术已使一些化合物进入临床试验。科学界必须仔细审查已知信息,以解决可重复性危机。只有在有足够的事实依据以及在后期管线阶段适当的人为干预下,人工智能在药物发现中的全部潜力才能得以实现。
1.引言
药物发现是一个旨在识别、设计和开发新型治疗药物以治愈、改善或预防疾病和医疗状况的系统性科学过程。药物发现通常被称为一个管线,暗示从命中的化合物/先导化合物到候选药物和上市药物的单向过渡,这一过程得到了基础研究和临床研究的支持。实际上,这一过程本质上是迭代的、多面的和复杂的。例如,小分子药物发现需要:(a)基础科学研究和靶点识别;(b)靶点药理学和生物标志物开发;(c)先导化合物识别;(d)先导化合物优化、候选药物选择、新药临床试验申请(IND)支持研究以及制造放大;(e)临床研究和开发;(f)监管审查;(g)上市后;以及(h)医疗实践部署。两种药物发现、开发和部署图(4DMs)描绘了药物开发生命周期中的关键步骤,一种用于小分子药物,另一种用于生物制剂,这些图展示了这一过程的相互依赖性和复杂性,可在国家转化科
学推进中心(NCATS)网站下载
(
https://ncats.nih.gov/translation/maps
)。
药物发现科学家使用各种技术和方法,如计算机建模、药物化学、高通量筛选(HTS)和生物测定,以识别有前景的化合物并评估其安全性、有效性和药代动力学。随着治疗方式的不断发展,药物发现过程正在通过引入新的数据科学、信息学和人工智能(AI)方法等技术来提高效率,减少成本和动物实验,从而加速新型有效治疗的开发。大数据和人工智能在药物发现中的影响是2020年本期刊一篇综述的主题,这一主题继续吸引着广泛关注:投资者、工业界和学术界的科学家以及立法者正在讨论人工智能在药物发现中的影响(AI4DD)。截至2023年7月31日,根据谷歌学术(
https://bit.ly/3FWk3dH
)的统计,自2019年以来,标题中有“人工智能在药物发现”字样的出版物已有65篇。
成功的药物批准需要同时优化与药效学、药代动力学和临床结果相关的多个属性。药效学属性与药物-靶点相互作用和有效性相关;适当的药代动力学包括吸收、分布、代谢、排泄、毒性(ADMET)和药物安全性;临床结果包括治疗意图,如药物适应症和超说明书用药的详细列表,以及不期望的结果,如副作用或不良药物反应。因此,成功的药物发现启动依赖于三大支柱:疾病、靶点和治疗方式。人工智能影响了大多数治疗方式,包括靶向蛋白质降解、抗体、基因治疗以及寡核苷酸和疫苗设计。在本综述中,我们探讨了AI4DD对这三大支柱的影响,主要关注小分子药物作为一种治疗方式。其对监管科学的影响以及AI4DD的一些注意事项也包括在内。
2.人工智能在药物发现中的兴起
2.1.知识缺口
人类研究者和人工智能系统在药物发现中面临的主要挑战之一是如何利用大量不同质量的异构数据。数据和计算能力的迅速扩展被称为是第四范式出现的理由,也被称为数据密集型科学发现。特别是对于“为什么”和“如果……会怎样”这类问题,必须识别相关且最好是可靠的数据,在数据缺失时进行推断,并通过基于证据的推理将它们连接起来,这可以通过“连线”的隐喻来说明。现代药物发现越来越需要能够智能推理和识别模式的计算机系统,即人工智能。这些人工智能系统必须能够权衡数据元素,并将这些模式的实例汇总起来以评估信心和依据。利用命名实体识别消化大量数据的自动化系统是公共领域数据库的重要组成部分,例如用于基因-疾病关联的DISEASES、用于蛋白质-蛋白质相互作用的邻近基因重复实例搜索工具(STRING),以及用于复杂疾病-蛋白质-药物注释的OpenTargets和Pharos,仅举几例。结合预测蛋白质结构的人工智能系统,如AlphaFold和RoseTTAFold,这些资源有望加速AI4DD。
2.2.小分子药物设计中人工智能的不完整历史
人工智能平台最终将推动药物发现的普遍概念可能早在科幻小说的早期就形成了。例如,像《星际迷航》这样的电视剧就曾出现过专门从事医学的全息影像(人工智能实体)解决医疗紧急情况的情节。早在1981年,华盛顿大学圣路易斯分校和默克研究实验室的科学家们就受到用计算机设计药物这一想法的激励。《计算机辅助分子设计杂志》于1987年创刊,自20世纪80年代以来,几乎每个十年,人工智能在药物发现中的概念都激发了我们的想象力。
1998年,Vertex和BASF的科学家独立提出了用于估计药物相似性的模型,从而出现了能够区分药物和非药物的机器学习(ML)模型,这表明可以根据化学特征训练ML模型来区分药物(具体来说,是药物化学家提议用于生物测试的化合物)和非药物(缺乏药用价值的化合物)。药物相似性面临的挑战是药物发现(特别是小分子药物)面临的普遍挑战的一个例证:药物质量并非化学物质的固有属性,因为监管机构以及隐含的人类批准化合物用于医学用途。此外,药物批准可能会随着时间的推移而被修订甚至撤销。尽管大多数市场撤销是由于药物毒性引起的,但缺乏疗效或经济原因也可能导致撤销。尽管存在这些注意事项,基于机器学习的药物相似性量化是药物发现过程的一个组成部分,近20篇独立论文专门讨论了药物相似性,相关内容在其他地方进行了讨论。
2.3.当前在药物发现中的影响
一项深入的科学计量分析显示,AI4DD 的出版物数量从 2011 年的 49 篇急剧上升到 2020 年的 333 篇。预计基于 AI 的药物发现平台的数量将在不久的将来增加。制药和生物技术行业之间经常存在协同关系,这推动了 AI 驱动的药物发现走向商业应用,而学术机构通常带头开发算法和方法。在过去二十年中,AI 和 ML 从边缘技术转变为在药物发现过程中占据核心地位。今天,我们比以往任何时候都更接近实现这一长期寻求的目标。
3.AI 在药物发现各个阶段的应用
3.1.疾病和治疗选择
计算技术的最新进展在医疗保健领域的 AI 应用方面取得了重大进展。AI 已被用于应对各种疾病,增强成像分析,协助疾病分类学,并检查药物适应症和治疗意图。鉴于 AI 在医疗保健中的应用显示出相当大的潜力,在本节中,我们讨论 AI 在转变医疗诊断和治疗方面的影响。
3.1.1.疾病和医疗保健
过去十年见证了疾病诊断方面的重大计算进展,有十篇或更多论文描述了在皮肤病学、结核病、阿尔茨海默病(AD)、糖尿病、高血压和癌症中使用 AI 的情况,其他地方已对此进行了综述。AI 在放射学、病理学、临床药理学以及 COVID 药物再利用等医疗保健领域的影响一直是讨论的话题。最近,ChatGPT(OpenAI 的一个大型语言模型)在美国医学执照考试中达到了 60% 的熟练度,这是一个值得注意的里程碑。AI 有可能在诊断、成像分析、患者 - 提供者互动、医院和养老院管理、使用社会决定因素的人群健康以及真实世界证据的收集和分析等领域对医疗保健管理产生影响。截至 2023 年 3 月 30 日,普遍的看法是 AI 将支持医疗保健专业人员,但预计在不久的将来不会取代他们。
3.1.2.基于图像的 AI
基于图像分析的 AI 系统已在放射学、病理学和皮肤病学等多个医学领域得到开发。病理学正在发展为数字病理学,这涉及将组织病理学、免疫组化和细胞学切片数字化,并在这些数字数据上训练 AI 系统。计算病理学旨在减少诊断和分类错误,同时加速生物标志物发现、病理生理学评估、动物研究和毒理学评估。在放射学中,AI 可以通过分析胸部 X 光、磁共振成像和计算机断层扫描来帮助放射科医生提高诊断水平并增强患者护理。然而,可能需要一个系统的框架来比较人类和 AI 在医学诊断中的感知。基于卷积神经网络(CNN)的机器学习模型在诊断特应性皮炎方面表现出接近医生的准确性。此外,这种 CNN 模型在区分特应性皮炎与其他皮肤病(如脓疱病、蕈样肉芽肿、单纯疱疹和卡波西水痘样疹)方面表现出色。
3.1.3.疾病分类学
疾病分类学,即对疾病术语进行分类、识别、交叉引用和协调的能力,对医疗保健 AI 系统来说是一个重大挑战。尽管存在许多疾病和表型本体,但 Mondo 疾病本体(Mondo)作为一种全面的、社区驱动的和计算驱动的资源正在兴起。对整合到 Mondo 中的资源进行的系统分析显示,与通常引用的 7000 种数字相比,有近 10500 种独特的罕见疾病。Mondo 成功地结合了人类和机器学习(贝叶斯)策划,这是人类和计算机智能在理解疾病方面合作的一个明确例子。
3.1.4.药物适应症和治疗意图
药物发现的一个关键方面涉及理解药物和疾病之间的关系,这在药物标签或药物适应症上有所规定,通常列在适应症和用法部分。包装说明书上未声明的用途称为超说明书用途。截至 2023 年 1 月,DrugCentral 数据库包含 2331 种美国食品药品监督管理局批准的人类药物,与 2644 种药物适应症和 866 种超说明书用途相关。治疗意图,即选择疗法的理由以及其被处方的背景,对医疗实践至关重要。尽管 DrugCentral 将药物用途映射到诸如系统化医学临床术语(SNOMED - CT)和医学主题词表(MeSH)等现有术语,这是两个全球健康术语标准,但计算上捕获治疗意图具有挑战性。治疗意图包括疾病概念和上下文因素,如预先存在的状况;共同处方的药物;特定基因型;以及各种表型、解剖学或时间参数。从文本中对药物适应症进行策划的最新进展通过 InContext得到扩展,它包括有关药物使用(特别是抗肿瘤和心血管药物)的治疗背景信息。然而,适当地捕获和验证超说明书医疗用途仍然需要手动策划。开发能够处理、验证和交叉映射疾病术语和治疗意图的 AI 系统是实现自动化药物发现和再利用的一个重要目标。
3.2.目标识别和验证
3.2.1.知识图谱
现代药物发现的一个关键早期步骤是目标识别。这个过程涉及发现和验证作为治疗模式的生物分子的临床相关性。尽管通常通过基因组学、蛋白质组学或表型实验来识别新的药物靶点,但机器学习作为一种目标识别技术越来越受到探索,通常通过知识图谱(KG)。知识图谱是一种使用图形结构化数据模型或拓扑结构来整合数据的知识库。药物发现知识图谱存储互相关联的节点描述(基因、表型或化合物),同时编码底层关系(边)。知识图谱数据投影使得基于网络的分析算法能够将复杂的药物发现数据转换为机器学习就绪文件。生物系统网络是异质的,具有多种节点和边类型(图 1)。
图 1.表型 - 蛋白质关联的知识图谱表示。节点(彩色圆圈)通过边(箭头)相互关联。以主要节点“靶点”为中心,顺时针列出的节点依次为:组织;细胞类型;蛋白质进化关系分析(PANTHER),一种蛋白质分类方案;Reactome,一个通路数据库;Jensen 疾病;人类孟德尔遗传在线数据库(OMIM);人类表型本体(HPO);同源物(列出具有共同进化起源的蛋白质),进一步链接到国际小鼠表型联盟(IMPC)小鼠表型数据库;癌症细胞系百科全书(CCLE);转录本、蛋白质和未审核蛋白质[各种类型的 UniProt条目];基因本体联盟(GO)术语;以及 Ramilowski 亚细胞定位,一个特定的亚细胞蛋白质定位实验资源。节点通过各种箭头与“靶点”相关联。例如,GO 术语具有多个蛋白质属性,而 String则为靶点循环蛋白质 - 蛋白质相互作用(PPIs);其他资源,如人类蛋白质图谱(HPA),则为组织、细胞类型和亚细胞定位及表达的多种节点提供信息。该图在 Jessica Binder 的帮助下绘制。
在异质关系预测方面的进展引入并正式化了一个新框架,通过定义类型特定的节点 - 边路径或元路径来考虑网络的异质性。元路径对源节点(例如,蛋白质靶点)和目标节点(例如,疾病或功能)之间的类型特定网络拓扑结构进行编码。类型特定的元路径如下:[靶点 - (属于)→蛋白质 - 蛋白质相互作用(PPI)网络←(属于) - 蛋白质 - (与)→疾病]和[靶点 - (表达于)→组织←(定位于) - 疾病]。可以使用例如度加权路径来组合类型特定的元路径计数,以减弱高度连接节点的影响。通过整合 Pharos中包含的异构数据类型,一个机器学习就绪的知识图谱可以捕获特定于人类蛋白编码基因的主要领域数据:表型和疾病、通路和相互作用。每个领域都有适当级别的数据,例如表达、关联、成员资格、治疗、定位和基因签名。每个元路径实例代表源和目标节点之间关联的特定证据链。
3.2.2.阿尔茨海默病的新型靶点
元路径框架可以与各种分类算法结合使用。在此案例中,XGBoost(一种极端梯度提升方法)被用于识别与阿尔茨海默病(AD)相关的新基因。通过将Pharos数据集(Illuminating the Druggable Genome计划收集的数据的网络界面)整合到XGBoost中,开发了一个专注于AD的模型,其中包括53个阳性(与AD相关)基因和3952个阴性(与AD不相关)基因。该模型的有效性通过三种生物学上不同的AD模型系统中的前20个和后10个基因进行了评估。这种方法发现了五个与AD免疫相关的先前未关联的基因靶点:FRRS1、CTRAM、SCGB3A1、CIBAR2和TMEFF2。这些基因在AD样本和对照样本之间表现出显著差异。该模型识别了与炎症过程和氧化应激相关的关键变量。尽管输入数据缺乏非人类信息,但AD特异性的XGBoost模型强调了感染在AD病理中的关键作用。越来越多的证据支持大脑感染可能是AD的主要原因这一假设。
3.2.3.自噬的新型基因
自噬(ATG)是一种细胞内生理降解过程,负责通过将蛋白质聚集体、病原体和其他货物传递给溶酶体进行降解来消除它们。尽管已知参与ATG的基因数量正在增加,但尚未建立用于识别与ATG相关基因的系统性实验方法。鉴于与ATG相关的基因组数据集的复杂性,开发了一个ATG特异性的XGBoost机器学习(ML)模型,以帮助设计相关实验。该ATG特异性的元路径XGBoost模型使用了103个与ATG相关(阳性)基因和3468个阴性(非ATG相关基因),并从Pharos收集数据。在预测具有ATG关联的前251个基因中,43个基因已在ATG数据库中,另外15个具有潜在的ATG关联。然而,193个基因(77%)与ATG没有明显的联系。这193个基因可以被视为ATG暗基因。通过回顾新发表的实验报告,验证了前20个预测的ATG暗基因中的7个和后预测的ATG暗基因中的2个。
3.2.4.基于知识图谱的机器学习模型解释
AD和ATG的XGBoost元路径模型表现出外部预测性,因为每个模型预测的前20个基因中有一些已经显示出有效的关联。在每个模型的排名最低的基因中也发现了一些有效的关联。由于XGBoost算法生成梯度(概率)输出,而输入标签是二元的(阳性为1,阴性为0),因此检查排名最高和最低的基因是一种合理的方法。排名最低的三个基因显示出AD和ATG的信号。建议同时考虑排名最高和最低的基因,因为机器学习(ML)输出不是绝对的。在相似性网络中,排名最高和最低的基因之间的区别更加明显。排名最高的基因更有可能与AD或ATG相关,而排名最低的基因似乎不太有组织,如STRING富集分析所示。两个模型都使用了一组超过3000个负标签基因;然而,没有实验已证实这些基因是ATG或AD的真正阴性。缺乏真实值(经过验证的真正阳性和真正阴性)可能是导致基于知识图谱的ML研究中观察到的复杂性和方差增加的原因。
在基于知识图谱的ML模型中,一个潜在的复杂问题是数据泄露,由于数据集的复杂性,这种情况可能会无意中发生。在基于ATG的ML模型的背景下,包含基因本体联盟(GO)和京都基因与基因组百科全书(KEGG)术语可能会引入与研究问题直接相关的信息。GO和KEGG都包含与ATG相关的术语。对ATG暗基因的后ML查询导致排除了一个排名最低的基因和两个排名最高的基因,因为它们被注释了与ATG相关的GO术语。数据泄露的影响是显著的,Kapoor和Narayanan将其描述为ML科学中的可重复性危机。在他们的分析中,在与生物学或医学相关的20个主题领域中,有15个检测到了数据泄露。
3.3.命中生成和先导优化
3.3.1.生物活性和ADMET属性的机器学习
定量构效关系(QSAR)是计算机辅助药物设计的基本方面,并且越来越多地被纳入到人工智能在药物发现中的应用中,包括生成化学和多属性优化(MPO)。QSAR起源于20世纪60年代Hansch和Fujita的工作,是第一个系统地应用机器学习来设计具有期望属性的小分子的方法。QSAR可以涵盖药物属性的所有方面,从基于靶点的生物活性到ADMET属性,如溶解度、渗透性和其他物理化学参数。QSAR方法是算法不可知的,并使用从分子结构(对象)派生的描述符(特征)来解释分子结构变化与感兴趣的分子属性之间的关系。QSAR在合成规划、材料科学、纳米技术和临床信息学等领域都有应用。QSAR技术是用于寻找抗COVID-19疗法的技术的重要组成部分。QSAR方法可以自动应用于数千个目标生物活性。阿斯利康、拜耳、默克和GSK的科学家们分享的最新经验突出了ADMET属性预测的复杂性。
传统上,定量构效关系(QSAR)和其他小分子性质机器学习(ML)模型以化学结构作为输入,通常以简化分子输入线性表示系统(SMILES)的形式进行编码。最近的一个发展是图卷积神经网络(GCNNs)的概念,该概念于2015年引入。GCNNs已被用于模拟药物组合、药物-靶点相互作用和多性质预测。严格分析表明,与经典的QSAR指纹相比,GCNNs并未提高预测性能。
3.3.2.生成化学
鉴于QSAR在计算机辅助药物设计中的基础性作用及其广泛的应用范围,该领域不断发展并纳入了更先进的技术,如生成化学。超大型化学库和生成化学方法的开发,特别是基于生成对抗网络(GANs)的方法,显著扩展了用于命中化合物生成和药物发现的可能性。GANs受到博弈论和深度学习的启发,在化学中找到了应用,例如第一个用于抗癌化合物设计的深度学习GAN。该应用采用了一个七层对抗自编码器架构,以生长抑制百分比作为判别器。该工作流程中的ML步骤使用了NCI-60数据、GI50(50%生长抑制)和6,252种化合物在MCF-7细胞系上的化合物对数浓度(LCONC)数据,将GAN聚焦于在较低的LCONC下实现更好的GI50。使用32个概率向量,从PubChem筛选了7,200万种化合物,每个向量最多有10个命中化合物。超过三分之一的选定化合物在癌症实验中表现出活性,或因其抗癌潜力而获得专利。在此方法的基础上,训练了一个GAN以生成JAK3选择性分子,使用了纠缠条件对抗自编码器。这导致了低微摩尔级JAK3抑制剂的发现,该抑制剂在JAK2、BRAF和RAF1上的效力显著较低。以下描述了其他生成化学平台。
3.3.3.多性质优化
多目标决策制定的数学建模自20世纪60年代以来就很普遍。当时,基于预定义目标或标准评估替代方案的过程被表示为n维向量,这些向量受到帕累托优化的约束,旨在寻找非支配解。霍普芬格(Hopfinger)在1985年将这一讨论框定在计算机辅助药物设计方面。帕累托优化已成为MPO的首选方法,因为它可以识别目标之间的权衡,从而发现非支配解。当评估呈负相关的药物性质时,这尤其有用。例如,将药物渗透性增加一个对数单位,可能会导致水溶性降低多达两个对数单位。因此,在优化药物性质时,通常需要为每种药物性质寻找非最大解。
在工业规模上对药物起点(如命中化合物和先导化合物)进行MPO的计算机应用在二十年前开始受到关注。第一个自动化的药物发现实现于2012年披露,后来成为Exscientia的基础技术,Exscientia是一家基于AI的药物设计公司。该特定的MPO平台编码了靶点和非靶点生物活性、ADMET性质和其他标准。它使用了经过拉普拉斯修正的贝叶斯分类器,该分类器经过多药理学分析训练,并采用了基于帕累托的自适应优化的向量标量化解析过程。TorchDrug是一个基于PyTorch构建的开源AI4DD平台,它利用深度学习的力量来识别新药。它支持性质预测、预训练的分子表示、生成化学和生物医学知识图谱推理。另一个平台,REINVENT,通过将强化学习用于生成化学模型,结合多样性过滤器和灵活的评分函数,支持MPO。REINVENT依赖于PyTorch和RDKit作为化学引擎,使用在scikit-learn库中实现的预测ML模型,并利用PyTorch中TensorBoard的实现来详细记录化学空间导航过程。
生成张量强化学习(GENTRL)是一种GAN方法,用于生成DDR1和DDR2抑制剂。含有盘状结构域的受体酪氨酸激酶1和2(DDR1和DDR2)是胶原蛋白受体。DDR1在肿瘤发生、转移和纤维化中起作用,使其成为一个有吸引力的药物靶点。GENTRL在ZINC数据库的清洁先导化合物子集上进行训练,该子集富含来自ChEMBL的已知活性和非活性激酶抑制剂。此外,它还在专利化学结构、结构(X射线)数据和DDR1/DDR2特异性药效团上进行训练。GENTRL的初始输出包括30,000种化合物,这些化合物经过筛选和优先排序,以消除不理想的骨架、反应性基团和不太可能是激酶抑制剂的化合物。这一过程产生了六种被预测为DDR1和DDR2抑制剂的新化合物。在合成和实验测试抑制活性后,化合物1和化合物2分别被发现是对DDR1和DDR2的强效(纳摩尔范围)抑制剂(见图2)。从提名DDR1到生成化合物6的整个过程仅用了35天。进一步的实验表明,化合物1在小鼠中具有口服生物利用度,在15 mg/kg剂量后半衰期为3.5小时。
图 2.两种上皮盘状结构域受体抑制剂(化合物 1 和 2)的化学结构,这些化合物是通过 GENTRL生成化学方法开发的;化合物 1 与普纳替尼(左下)具有显著的化学相似性。展示了社区驱动的抗疟疾人工智能(AI)竞赛化合物之一 MMV1803022 的结构和生物活性(居中底部)。Pfal 概括了恶性疟原虫(3D7)无性血阶段寄生虫成熟的体外生长抑制;PfATP4 表示确认的靶向生化(细胞质 [Na+] 增加)抑制。AI 发现的抗菌剂哈里辛显示在右下角。缩写:CID:PubChem 化合物标识符;DDR,盘状结构域受体激酶;GENTRL,生成张量强化学习。化合物 1 和 2 的生物活性数据来自参考文献 121,普纳替尼的生物活性数据来自 DrugCentral,抗疟疾化合物 MMV1803022 的生物活性数据来自参考文献 127,哈里辛的结构来自 PubChem(https://pubchem.ncbi.nlm.nih.gov/compound/Halicin)。
3.3.4.社区参与
治疗数据共享(TDC;https://tdcommons.ai/)托管多个机器学习就绪的数据集,以系统地推进AI4DD技术。TDC设有22个ADMET性质、5个药物组合基准、1个对接和1个药物-靶点相互作用数据集的排行榜(总共29个),在此基础上进一步发展了早期的分子机器学习基准。例如,MolE深度学习基础模型在22个ADMET性质数据集中的9个中表现出卓越性能。QSAR社区广泛使用在线化学建模环境(OCHEM;https://ochem.eu/),这是一个用于机器学习模型开发和存储的在线平台。OCHEM为多任务学习提供了一个统一的界面,这是一种有望提高预测性能的方法。一些基于靶点的多性质机器学习模型可在在线获取:NCATS预测器
(https://predictor.ncats.io/)拥有1,180种不同的模型,而Redial-
2020(http://drugcentral.org/Redial)估计12种性质以评估对COVID活性
的化合物。对于ADMET,可以考虑ADME@NCATS(https://opendata.ncats.nih.gov/adme/)门
户网站或ADMETlab 2.0(https://admetmesh.scbdd.com/),后者不仅包括ADMET性质,还包括可能有助于药物化学家的参数。多个学术和工业团队通过针对疟原虫PfATP4(来自恶性疟原虫的P型ATP酶)参与了一个开放的AI4DD抗疟药物竞赛。MMV1803022是一种PfATP4抑制剂,通过[Na+]增加引起细胞质碱化,并对P. fal
ciparum具有活性(见图2)。
生成化学的输出需要人类监督。在生成步骤之后,需要主动过滤器以去除可能具有反应性和化学不可行的物种以及超出所需性质空间的化合物。即使是经过成功测试的AI设计的化合物,也可能因其缺乏新颖性而受到批评。例如,化合物1(图2)因其与批准的激酶抑制剂ponatinib的相似性而受到批评。一种于2020年披露的AI设计的抗生素halicin(图2)在PubChem BioAssays中有12份活性报告(
https://bit.ly/halicinAssays
),包括2017年针对结核分枝杆菌的活性抗生素结果。根据《化学与工程新闻》,研究人员“由于其与美国食品药品监督管理局正在评估的化合物相似,选择不追求[halicin]”。这些案例突显了在药物发现中提高AI生成化合物新颖性的需求。
3.4.药物安全性:通往临床试验之路
临床前安全性评估采用体外和体内测试,以确保在首次人体试验之前患者的安全性。体外毒理学测试旨在早期检测可能对药物发现计划进展产生严重影响的毒性,并且有多种检测格式,从标准的单终点筛查到最近更复杂的体外模型系统,包括微生理学或器官芯片模型。这些体外模型系统在体内研究之前或与之并行应用。AI 在这一领域的增强涉及将多种更复杂的数据形式(例如基因表达、细胞染色)结合起来,以及更广泛地应用成像技术用于各种数据处理应用。一个例子是应用深度学习从体外三维人体皮肤模型中检测皮肤毒性。
3.4.1.预测毒理学
小分子多参数优化(MPO)设计(上文已讨论)包括对体外输出的毒性预测,这些输出与器官毒性(如细胞毒性、线粒体毒性)或预测非靶点毒性以及遗传毒性的代表性检测相关。新的进展包括分析新的数据类型,例如基因表达数据和细胞成像实验数据,结合化学结构信息,以预测体内毒性相关效应。使用生物学指纹,单独使用或与结构指纹结合使用,可以更好地将化合物与体内表型联系起来,有时具有更好的预测能力。将生物学矩阵纳入其中的优势在于更好地识别仅通过结构相似性无法完全捕捉到的表型细微差异,并且可以通过在生物学矩阵中包含估算值来进一步促进这一点。一个例子是应用神经网络填充稀疏的激酶结合矩阵。预测毒理学的一个重要方面是暴露背景下的毒性以及理解安全阈值。贝叶斯机器学习方法已被证明可用于从机制相关的体外数据和动物暴露数据中预测临床结果。此外,AI 增强的临床药理学方法可以通过利用电子健康记录、生物标志物数据和患者基因组学数据等数字数据源,对剂量推荐、药物相互作用预测和不良药物反应预测产生影响。基于知识图谱的机器学习方法,将药品说明书中的副作用信息、靶点信息和适应症信息纳入其中,在预测不良事件方面显示出潜力。
3.4.2.监管应用
监管机构对 AI4DD 及其用途的兴趣日益增加。将计算工具应用于评估药物相关杂质的致癌潜力,导致结构 - 活性预测作为监管提交的一部分被纳入其中。2018 年,欧洲药品管理局发表了一篇反思性论文,讨论在缺乏实验数据时,使用计算机模拟工具评估非致突变杂质相关风险。最近,监管机构发表了更全面的观点,涉及 AI/ML 在药物开发和药物制造中的使用,并积极与利益相关者互动以获取反馈。
在监管应用中使用 AI 引入了一个新的方面,要求模型足够透明,以便卫生当局评估其可用性和可靠性。跨行业联盟一直在努力正式使用计算机模拟工具,包括 AI/ML 模型,以确保数据集来源和质量以及算法的透明度,从而获得监管认可。
AI 在各种应用中逐渐受到关注,例如与职业毒理学、化学品运输和医疗器械相关的化学风险评估,其中皮肤致敏性、刺激性和大鼠急性口服毒性等终点通常被包括在内。在建模和模拟领域,该领域现在是一种标准工具,用于在扩展到其他临床人群或适应症时展示对生理学或安全性的影响,正在努力制定模型评估标准。国家毒理学研究中心与药物评价与研究中心合作,启动了 SafetAI 计划
(
https://www.fda.gov/about-fda/nctr-research-focus-areas/safetai-initiative),以开发对评估药物安全性至关重要的毒理学终点的 AI 模型,可能在 IND 审查过程中发挥作用。该项目专注于开发基于深度学习的肝毒性、致癌性、肾毒性等模型。它利用各种体外数据源,如高通量转录组学,以及化学表示来预测体内结果。
4.AI 驱动药物发现成功的简要概述
首个 AI 设计的化合物是 DSP-1181,这是一种强效且长效的 5-HT1A 受体激动剂(161)。DSP-1181 是使用 Exscientia 的 MPO 方法 Centaur Chemist 在不到 12 个月内设计的。2020 年 1 月,住友大阪制药将 DSP-1181 推进到针对强迫症的 I 期临床研究。DSP-1181 的化学结构尚未公开。化学文摘社的分析师建议 DSP-1181 与氟哌啶醇相似。由于氟哌啶醇是一种弱 5-HT1A 拮抗剂(数据未显示),我们推测它与 gepirone 相似,gepirone 是一种低效能的 5-HT1A 激动剂。另一种 AI 设计的化合物 DSP-0039 是一种双重 5-HT1A 激动剂和 5-HT2A 拮抗剂,且没有多巴胺 D2 受体活性。2021 年 5 月,住友大阪制药将其推进到针对阿尔茨海默病精神病的 I 期临床研究(见图 3 了解详细信息)。
图 3.Exscientia 专利中报告的化合物示例。吉吡酮(左上)与示例 1(CAS 注册号 2244686-21-1,右上)共享药理学特征。示例 109(CAS 注册号 2410053-86-8,底部)与已知药物没有化学相似性。吉吡酮的生物活性数据来自 DrugCentral,专利示例的数据来自参考文献 162 和 164。
缩写:CID,PubChem 化合物标识符;D,多巴胺 D2 受体;hERG,人类 Ether-à-go-go 相关基因;Ki,抑制常数。
Exscientia 在功能精准肿瘤学方面取得了显著的 AI 驱动进展。单细胞功能精准医学(scFPM)平台成功地指导了治疗选择,并在一项前瞻性临床研究中提高了患者的治疗效果。在利用 scFPM 方法的研究中,对来自 143 名血液系统恶性肿瘤患者的样本进行了 139 种药物的测试。在根据 scFPM 结果接受治疗的 56 名患者中,30 名(54%)的无进展生存期比之前的治疗增加了 1.3 倍以上。此外,12 名(占反应者的 40%)的反应持续时间比其各自疾病的预期时间长了三倍。与接受医生选择的治疗的患者相比,接受 scFPM 治疗的患者显示出显著的总生存期益处。
Insilico Medicine 的 ISM01-055(也称为 ISM018-055)可能是首个于 2023 年 6 月进入 II 期临床试验的 AI 设计化合物。
ISM018-055 是使用 PandaOmics和 Chemistry42平台设计的,可能受到专利保护,其靶点是 NCK 相互作用蛋白激酶 TNIK,用于治疗特发性肺纤维化。
Relay Therapeutics 是一家专注于分子动力学的 AI4DD 公司,披露了 RLY1971(见图 4),这是一种口服可用的 PTPN11(SHP2)别构抑制剂。RLY-1971 可阻断野生型 PTPN11(IC50 <1 nM)和 E76K 激活突变体(IC50 <250 nM),目前正在进行针对受体酪氨酸激酶(RTK)/RAS 通路驱动的实体瘤的 I 期临床试验。2020 年 12 月,RLY-1971 被基因泰克公司授权。RLY-4008 是一种高选择性、高效且不可逆的成纤维细胞生长因子受体 2(FGFR2)抑制剂,在胆管癌中有效(见图 4)。
图 4. RLY-1971(米戈普罗他菲布或 GDC-1971)(左)和 RLY-4008(利拉富格拉替尼)(右)的化学结构,这两种化合物均由 Relay Therapeutics 推进至 I 期临床研究。虽然 RLY-4008 的确切生物活性尚未披露,但它对 FGFR1 和 FGFR4 无效,这反过来可能消除了不想要的副作用。缩写:CID,PubChem 化合物标识符;FGFR,成纤维细胞生长因子受体。
5.AI 在药物发现中的挑战和局限性
“AI 在药物发现中”的说法可能给人一种印象,即 AI 在早期药物发现中得到了成功应用。尽管这一说法有一定道理,但需要注意的是,没有任何一种获得监管机构批准的药物可以像 AI 在国际象棋、围棋、危险边缘、自动驾驶汽车、诗歌生成和蛋白质折叠等领域取得胜利那样归因于 AI。药物发现是一个复杂且多面的过程,正如 4DM 图表所捕捉到的那样。机器人科学家 Adam 独立进行了基因组学实验,机器人科学家 Eve 开展了针对抗疟疾化合物的高通量筛选活动。尽管计算机辅助过程已被用于化合物的选择和优化,但目前还没有能够执行完全自动化药物发现的 AI 驱动的机器人科学家或数字等价物。完全自动化的 AI 驱动药物发现仍然是一个值得追求的目标。迄今为止的大多数成功案例都依赖于机器学习、化学信息学、生物信息学软件、自然语言处理或其他支持人类决策的计算平台。总之,药物发现尚未从一个全面的 AI 系统中受益。
AI4DD 在小分子方面的一个薄弱环节是训练编码化学特征(通常称为 QSAR)的机器学习模型,例如从化学结构中衍生出来的模型。Bohacek 等人估计药物样化学品的数量可达 1060,虚拟筛选库中的化合物数量已超过 360 亿种。考虑到每种分子估计有 10–50 种构象,总共超过 5000 亿个对象,虚拟筛选 360 亿种化合物的物流和实际挑战是巨大的,超出了本综述的范围。相反,我们的关注点是与适用性领域和外部预测能力验证相关的实际问题。如上所述,验证和适用性都是基于靶点的知识图谱机器学习模型面临的挑战。
在人工智能用于药物发现(AI4DD)中,常用的机器学习(ML)模型通常仅在数万种化合物上进行训练,这引发了人们对它们在涵盖360亿种化合物的化学空间中采样有效性的质疑。我们能否自信地假设,如此相对较小的训练集能够有效地代表360亿种化合物的化学空间?这样的预测值得信赖吗?机器学习特征空间中的适用性领域(一个代表性问题)和化学多样性(即使在适用性领域内,未见过的骨架结构也不太可能产生可靠的预测)都引发了对ML模型在未探索的化学宇宙中预测能力的担忧。理想情况下,AI4DD从业者希望使用经过充分训练的ML模型系统地采样化学空间。在先导化合物优化过程中,这一点变得尤为重要,因为进展依赖于在ML空间中对相关化学骨架的准确表示。
药物发现中的靶点鉴定也受到所谓的可重复性危机的影响。拜耳和安进报告称,高影响力出版物的可重复性率很低,分别为33%和11%,许多生物医学出版物是虚假的。从人工智能的角度来看,过滤虚假数据需要整个社区的协调努力。eLife的可重复性项目的经验教训突显了诸如比之前发表的效果更弱和协议描述不准确等问题,该项目专注于癌症生物学。此外,虚假信息在该领域的可能性进一步增加,这包括索引伪造的出版物或由研究论文工厂生成的出版物。这些实验数据方面的挑战加剧了机器学习模型的准确性问题和机器学习科学的可重复性危机。为了使AI4DD有效,它需要以事实为依据。