深度学习的模式开始在药物研发领域崭露头角。
上个月,加州圣布鲁诺的 Numerate 公司与武田药业(Takeda Pharmaceutical)正式签约,就使用 Numerate 公司的人工智能技术(artificial intelligence, AI)寻找肿瘤学、胃肠病学和中枢神经系统疾病的小分子药物展开合作。同样是上个月,麻省 GNS Healthcare 公司宣布与位于加州南旧金山的 Roche 子公司 Genentech 达成协议,使用 GNS 的 AI 平台分析已知疗法在肿瘤学中的功效。今年 5 月,苏格兰 Exscientia 公司与法国 Sanofi 签署了一项潜在价值为 2.5 亿欧元(约 2.8 亿美金)的合作和许可交易,旨在开发针对代谢疾病的双特异性小分子药物。Exscientia 将利用其人工智能技术设计化合物,而 Sanofi 则提供化学合成。近年来,药企和 AI 公司携手的案例比比皆是。长期以来,药企对 AI 技术怀有质疑,但由于 AI 技术有潜力解决药物开发过程的难题——临床失败率,药企开始看好,甚至引入 AI。
药企对 AI 技术的兴趣主要源于这样一个事实:传统的药物研发耗时耗力,且失败率高。20 年来临床成功率持续下降,直到最近才有所改善(Nat. Rev. Drug Disc. 15, 379–380, 2016)。然而,现在进入临床 1 期的药物中只有十分之一能通过整个临床试验。伦敦 BenevolentAI 分公司 BenevolentBio 的首席执行官 Jackie Hunter 指出,有一半的临床试验失败是由于候选药物缺乏有效性。也就是说靶标不对,即使降低 5% 或 10% 的治疗失败率,也能非常让人吃惊。Hunter 对 AI 在药物研发上的潜力的看法在上个月发布的《安永:2017 全球生物技术报告》(Ernst & Young’s Biotechnology Report 2017)中有所介绍。
一直观望 AI 发展的公司现在纷纷涉足 AI 领域。最著名的药物研发深度学习模型可能是 IBM 的 Watson 机器人。IBM 于 2016 年 12 月与 Pfizer 公司签署协议,协助 Pfizer 的免疫肿瘤药物研发,除此之外,IMB 还和多个药企有合作协议(Nat.Biotechnol. 33, 1219-1220, 2015)。IBM 的 Watson 机器人可以快速分析大量的文本数据,并使用大量实验室数据、临床报告和科学出版物测试猜想,以此来寻找潜在药物(BenevolentAI 挖掘文献和研究数据库的算法与沃森非常类似)。
生物医学的海量数据驱动了制药行业对 AI 的兴趣(下表)。不断增加的计算能力和大型数据集的扩散促使科学家们寻求可以帮助他们浏览大量信息的学习算法。
药企对 AI 的兴趣其实是受其它领域的感染的。常用于无人驾驶汽车的机器视觉,以及语言处理,为复杂的多级人造神经网络——深度学习算法的诞生奠定了基础。在生物领域,深度学习可基于测定数据和文本数据建立生物过程模型。
耶鲁大学生物(Yale University)医学信息学教授 Mark Gerstein 指出,过去人们没有足够的数据来适当地训练深度学习算法。但是现在研究人员已经能够建立大量的数据库,并利用这些数据来训练算法了。Gerstein 认为药企对 AI 的看好是很有道理的。
Numerate 公司是越来越多的、将数据用于药物发现的 AI 公司之一。Numerate 首席执行官 Guido Lanza 表示,他们将 AI 应用于各个阶段的化学设计。Numerate 和东京 Takeda 公司合作,筛选靶标分子,设计和优化化合物,对药物吸收、分布、代谢和排除以及毒性进行建模,为 Takeda 提供临床试验候选药物。该协议的金额和特许权使用费并未披露。
不光药企,学术实验室也开始采用 AI 工具。今年 4 月,旧金山 Atomwise 公司发起了人工智能分子筛选奖励计划(Artificial Intelligence Molecular Screen),向多达 100 个大学研究实验室免费提供 72 种潜在的治疗化合物。Atomwise 是多伦多大学的校友创业公司,并于 2015 年与默克公司达成合作。Atomwise 将使用 AtomNet 平台筛选 1000 万个分子,并为每个实验室提供 72 个靶向该实验选择的靶标的化合物。
日本政府于 2016 年推出了一个研究联盟,旨在帮助国内数十家公司和机构使用日本 K 超级计算机,从而提高药物发现效率。其中包括 Takeda、Fujitsu、NEC、京都大学医院(Kyoto University Hospital)、日本理化学研究所(RIkagaku KENkyusho/Institute of Physical and Chemical Research, Riken),以及提供临床资料的日本国家研究发展研究所(Japan's National Research and Development Institute)。
基因组数据分析初创公司 WuXi NextCode 与耶鲁大学(Yale University)的研究人员合作,共同使用该公司的深度学习算法来识别血管生长的关键机制。结果可以推动抑制肿瘤血管生长的药物研发(Nature 10.1038 / nature22322,2017)。
美国奥巴马政府期间,作为癌症登月计划(Cancer Moonshot initiative)的一部分,工业和学术界联合力量,应用人工智能加速药物发现(Nat.Biotechnol. 34, 119, 2016)。在 2016 年 1 月推出的加速医学治疗研发计划(Accelerating Therapeutics for Opportunities in Medicine, ATOM)中,英国 GSK 公司、加州利劳伦斯利物莫国家实验室(Lawrence Livermore National Laboratory)和美国国家癌症研究所(US National Cancer Institute)强强联手,将计算方法和实验方法结合起来,推动肿瘤药物研发。该计划的计算部分,包括深度学习和其它 AI 算法,将在头两年内接受测试。GSK 公司的负责人 Martha Head 表示,他们希望一开始就有一个正确的假设,然后一年内推出候选药物。
学术实验室研发的 AI 技术引发了 AI 创业大潮,并促进了致力于加速药物发现的合作。上个月,巴尔的摩的 Insilico 医学公司公布了 ALS.AI,一个致力于肌萎缩性侧索硬化症的个性化药物发现和生物标志物开发平台。该公司主要从学术界吸取教训,专注于生成拮抗网络——一种深度学习算法,它能令两个神经网络建立拮抗关系,其中一个网络尝试开发一个模型,并不断改进这个模型,直到第二个网络无法区分模型是否处于构建阶段。该公司使用该工具分析在不同分子孵育情况下,人类细胞系的转录和转录反应数据的数据库,以预测分子的治疗性质。Insilico 医药公司首席执行官 Alex Zhavoronkov 表示,他们主要观察正常组织和疾病组织的基因的表达变化。然后他们看看什么分子可以改变这个差异。AI 还有可能将算法应用于表型和定性分析(一般需要几周,甚至数月)以加快临床前开发过程。
但是,作为药物发现工具,AI 需要数据集才能进行培训,而数据访问仍然是一个重大挑战。大型制药公司拥有可追溯到 20 世纪 80 年代的大型临床前数据集,这部分数据可能可以被共享。实际上,许多公司都参加了各种化合物分享和再利用计划。Heads 指出 GSK 正在向 ATOM 提供测定数据、遗传数据、药物代谢和药代动力学数据。她认为她们提供了一些进入临床试验,但因为种种原因失败的分子的相关数据,同时还有来自她们早期发现过程的大量数据。Numerate 的首席技术官 Brandon Allgood 表示,尽管如此,在许多情况下,大型制药公司的数据组织形式并不完善,这需要数字化才能有用,才能‘有东西可挖’”。
另一个挑战是成本了。在机器视觉领域,研究人员可以建立大量的数据集,因为每个数据点的成本是微不足道的。但在制药行业,数据点可就非常昂贵了,因此制药行业不需要大量数据的算法。为此,斯坦福大学(Stanford University)的研究人员将一类计算机视觉算法、单点学习的算法进行调整,使其适用于药物研发,最后得到一种可以根据非常少的数据来对药物属性进行预测的算法。
Allgood 指出,展望未来,深度学习和其它 AI 算法,以及硬件和软件的进步都有望对药物研发产生重大影响。此外,理论上,小分子药物的种类可以达到 1060 左右。Allgood 还提出,在做决定之前,“我们应该利用所有的数据,建立 N 个新模型,尽可能探索更多的分子类型。”
人造智能领域的最大项目是 Google 的深度学习项目 Google Brain。目前该项目已经聘请了许多世界领先的人工智能研究人员。Google Brain 的团队一直在扩大,并且最近针对量子化学的深度学习进行了调整。业内许多人表示,就算谷歌的母公司 Alphabet 在不久的将来开一家 AI 药物研发公司,他们都不会惊讶。
但是,只有当 AI 公司真的能提高药物开发成功率时,AI 技术才会成为生物药物开发的主导。Insilico Medicine 的 Zhavoronkov 指出,到目前为止,生物信息学并没有提高药物开发的成功率,这使得大型制药公司对 AI 的“巨大潜力”心怀警惕。Zhavoronkov 不认为业内对 AI 有多信任,但是兴趣确实很大。只有当制药领域也出现第一个成功案例,整个行业才会真正引入 AI。
原文检索:
AI-powered drug discovery captures pharma interest