谷歌最近联合休斯顿卫理公会医院、斯坦福大学等推出了 AI co-scientist,这是一个使用 Gemini 2.0 构建的多智能体 AI 系统,作为虚拟科学协作者,可帮助科学家生成新的假设和研究提案,并加快科学和生物医学发现的时钟速度。
在追求科学进步的过程中,研究人员将独创性和创造力与以文学为基础的洞察力和专业知识相结合,以产生新颖可行的研究方向,并指导随后的探索。在许多领域,这都带来了广度和深度的难题,因为在整合来自不熟悉领域的见解的同时,驾驭科学出版速度的快速增长是一项挑战。然而,克服这些挑战至关重要,跨学科努力产生的许多现代突破就证明了这一点。例如,Emmanuelle Charpentier 和 Jennifer Doudna 因其在 CRISPR 方面的工作而获得 2020 年诺贝尔化学奖,该研究结合了从微生物学到遗传学再到分子生物学的专业知识。
在现代科学发现过程中未满足的需求的推动下,并基于最近的 AI 进步,包括跨复杂主题进行综合以及执行长期规划和推理的能力,我们开发了一个 AI 联合科学家系统。AI 联合科学家是一个多代理 AI 系统,旨在作为科学家的协作工具。AI co-scientist 基于 Gemini 2.0 构建,旨在反映支撑科学方法的推理过程。除了标准的文献综述、总结和“深入研究”工具之外,AI 联合科学家系统旨在发现新的原创知识,并基于先前的证据并根据特定的研究目标量身定制,并制定明显新颖的研究假设和建议。
https://storage.googleapis.com/coscientist_paper/ai_coscientist.pdf
https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#project-astra
科学发现依赖于科学家生成新颖的假设,并通过严格的实验验证。为了加强这一过程,我们引入了一种人工智能合作科学家,一个基于双子座2.0的多智能体系统。该人工智能合作科学家旨在帮助揭示新的原创知识,并制定可证明的新颖研究假设和提案,建立在先前的证据之上,并与科学家提供的研究目标和指导保持一致。该系统的设计采用了生成、辩论和进化的假设生成方法,受到科学方法的启发,并通过扩展测试时间计算来加速。主要贡献包括:(1)一种具有异步任务执行框架的多代理架构,用于灵活的计算扩展;(2)一种锦标赛进化过程,用于自我改进假设生成。自动化评估显示测试时计算的持续效益,提高了假设质量。虽然通用,但我们在三个生物医学领域专注开发和验证:
药物再利用、新靶点发现和解释细菌进化及抗微生物耐药性的机制
。对于药物再利用,系统提出了具有有前途的验证结果的候选药物,包括在临床适用浓度下在体外显示肿瘤抑制的急性髓性白血病候选药物。对于新靶点发现,人工智能合作科学家提出了新的肝纤维化表观遗传靶点,通过抗纤维化活性和人类肝器官体中的肝细胞再生得到验证。最后,人工智能合作科学家通过对细菌进化中新基因转移机制的平行虚拟发现,复现了未发表的实验结果。这些结果在分别同时发布的报告中详细说明,展示了增强生物医学和科学发现的潜力,并开启了一个由人工智能赋能科学家的时代。
https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/
核心速览
研究背景
-
研究问题:这篇文章要解决的问题是如何通过人工智能(AI)辅助科学家加速科学发现过程。具体来说,研究旨在开发一个AI合作者(AI co-scientist),该系统能够帮助科学家生成新的、原创的知识,并提出新的研究假设和提案。
-
研究难点:该问题的研究难点包括:生物医学领域的复杂性和深度;跨学科的知识和洞察力需求;以及现有的AI技术在推理能力和多模态理解方面的局限性。
-
相关工作:该问题的研究相关工作包括:AlphaFold在蛋白质结构预测方面的进展;AI在药物发现和材料科学中的应用;以及AI驱动的科学发现的研究。
研究方法
这篇论文提出了AI合作者系统,用于解决科学发现过程中生成新知识和假设的问题。具体来说,
-
多代理架构
:系统采用基于Gemini 2.0的多代理架构,包含异步任务执行框架,允许灵活扩展计算资源,以支持科学推理。
-
生成、辩论和进化过程
:系统设计了一个生成、辩论和进化的过程来生成假设。生成代理通过文献搜索和模拟科学辩论生成初始假设;反思代理通过文献回顾和模拟实验验证假设的正确性;排名代理通过Elo评分系统对假设进行排序;进化代理通过多种方法改进假设;元评论代理综合所有评论,优化后续生成过程。
-
测试时计算扩展
:系统利用测试时计算扩展来迭代推理和改进假设。通过自我对弈和科学辩论等策略,系统能够在收集更多知识时逐步改进输出。
实验设计
-
数据收集:系统使用Gemini 2.0作为基础语言模型,并从开放获取的文献中进行知识抽取。
-
实验设计:系统在三个生物医学领域进行开发和验证:药物再利用、新治疗靶点发现和细菌进化机制的解释。每个领域的实验设计都包括生成假设、专家反馈和实验室验证。
3. 样本选择:在药物再利用实验中,系统从2300种药物中生成假设,并通过专家评估和体外实验验证;在新治疗靶点发现实验中,系统针对肝纤维化生成假设,并通过体外实验验证;在细菌进化机制解释实验中,系统独立生成了关于噬菌体诱导染色体岛(cf-PICIs)传播机制的假设,并通过独立研究验证。
4. 参数配置:系统在生成假设时,设置了多个偏好和约束条件,以确保生成的假设与研究目标和科学家提供的指导一致。
三个医药试验
急性髓性白血病的药物再利用
药物开发是一个越来越耗时和昂贵的过程,其中新疗法需要针对每个适应症或疾病重新启动发现和开发过程的许多方面。药物再利用通过发现现有药物超出其最初预期用途的新治疗应用来应对这一挑战。但是,由于任务的复杂性,它需要广泛的跨学科专业知识。
我们应用 AI 合作科学家来协助预测药物再利用机会,并与我们的合作伙伴一起通过计算生物学、专家临床医生反馈和体外实验验证预测。
值得注意的是,AI 合作科学家提出了急性髓性白血病 (AML) 的新型再利用候选药物。随后的实验验证了这些提议,证实了建议的药物在临床相关浓度下抑制多种 AML 细胞系中的肿瘤活力。
三种新型 AI 联合科学家预测的 AML 再利用药物之一的剂量反应曲线。KIRA6 在临床相关浓度下抑制 KG-1 (AML 细胞系) 活力。能够在较低药物浓度下降低癌细胞活力是有利的,原因有很多,例如,因为它减少了脱靶副作用的可能性。
推进肝纤维化的靶点发现
确定新的治疗靶点比药物再利用更复杂,并且通常会导致假设选择效率低下以及体外和体内实验的优先级不佳。AI 辅助靶标发现有助于简化实验验证过程,从而可能有助于降低开发时间成本。
我们探索了 AI 合作科学家系统为目标发现假设提出、排序和生成假设和实验方案的能力,重点是肝纤维化。AI 联合科学家通过识别基于临床前证据的表观遗传靶标来展示其潜力,这些靶标在人类肝脏类器官(3D,源自人类细胞的多细胞组织培养物,旨在模拟人类肝脏的结构和功能)中具有显着的抗纤维化活性。这些发现将在即将发布的一份报告中详细说明,该报告由斯坦福大学的合作者领导。
来自 AI 联合科学家建议的肝纤维化靶标与纤维化诱导剂(阴性对照)和抑制剂(阳性对照)的治疗比较。AI 合作科学家建议的所有治疗方法都显示出有希望的活性(所有推荐药物的 p 值为 <0.01),包括可能逆转疾病表型的候选药物。结果将在我们斯坦福大学合作者即将发布的报告中详细说明。
解释抗微生物药物耐药性的机制
作为第三次验证,我们专注于生成假设来解释与抗菌素耐药性 (AMR) 相关的细菌基因转移进化机制——微生物进化出的抵抗感染治疗药物的机制。这是另一个复杂的挑战,涉及了解基因转移的分子机制(偶联、转导和转化)以及驱动 AMR 基因传播的生态和进化压力。
对于这项测试,专家研究人员指示 AI 合作科学家探索一个在他们的小组中已经有新发现但尚未在公共领域披露的主题,即解释衣壳形成噬菌体诱导的染色体岛 (cf-PICI) 如何存在于多种细菌物种中。AI 合作科学家系统独立提出 cf-PICIs 与不同的噬菌体尾部相互作用以扩大其宿主范围。这种计算机发现已在使用 AI 合作科学家系统之前进行的原始新颖实验室实验中得到实验验证,并在我们与弗莱明倡议和伦敦帝国理工学院的合作者共同定时的手稿 ( , ) 中进行了描述。这说明了 AI 联合科学家系统作为辅助技术的价值,因为它能够利用数十年的研究,包括有关该主题的所有先前开放获取文献。
AI 合作科学家重新发现新型基因转移机制的时间表。蓝色:cf-PICI 动员发现的实验研究管道时间表。红色:AI 联合科学家开发和概括这些关键发现(无需先验知识)。
-
药物再利用
:系统生成了多个潜在的阿霉素再利用候选药物,并在体外实验中验证了其在急性髓性白血病(AML)细胞系中的活性。例如,Binimetinib在AML细胞系中的IC50值低至7 nM。
-
新治疗靶点发现
:系统为肝纤维化生成了新的表观遗传治疗靶点,并在人类肝器官模型中验证了这些靶点的抗纤维化活性。
-
细菌进化机制解释
:系统独立发现了cf-PICIs在不同细菌物种之间传播的机制,即cf-PICIs通过与不同噬菌体尾巴的相互作用扩展其宿主范围,这一发现与独立研究的结果一致。
总体结论
这篇论文提出了一个多智能体AI大模型合作者系统,通过生成、辩论和进化过程,帮助科学家生成新的研究假设和提案。系统在药物再利用、新治疗靶点发现和细菌进化机制解释方面展示了其潜力,并通过实验验证了其有效性。该系统为科学发现提供了一个强有力的工具,有望加速生物医学和科学研究的进展。
论文评价
优点与创新
-
引入AI合作科学家:开发并引入了一种AI合作科学家,超越了文献综述和“深度研究”工具,帮助科学家发现新知识、生成新颖的假设和实验计划。
-
测试时计算范式的显著:合作科学家基于Gemini 2.0多智能体架构,利用异步任务执行框架,实现了测试时计算的灵活扩展,促进了科学推理的迭代改进。
-
专家参与的科学工作流程:系统设计为与科学家协作,可以灵活地结合自然语言对话反馈,共同开发和改进输出。
-
生物医学领域的端到端验证:在药物再利用、新型治疗靶点发现和抗菌素耐药性机制解释等生物医学领域的重要主题中,展示了AI合作科学家生成的新颖假设的端到端验证。
-
多智能体架构:系统采用模块化多智能体架构,灵活地构建在通用前沿AI模型之上,并利用专用AI模型作为工具来增强能力。
-
自我改进的反馈循环:通过自我辩论和科学竞赛等机制,系统能够迭代改进生成的假设和研究提案,创建了一个自我改进的循环。
不足与反思
-
文献搜索、评论和推理的局限:AI合作科学家系统可能因依赖开放获取的文献而遗漏关键的先验工作,或在错误推理的情况下忽略现有工作。
-
缺乏负面结果数据的访问:系统仅使用开放的已发布文献,可能限制了访问负面实验结果或失败实验记录的机会,而这些数据可能对优先排序研究至关重要。
-
多模态推理和工具使用的改进:尽管最先进的边界模型可能在某些方面表现出色,但它们可能无法全面利用科学出版物中的视觉数据和其他非文本信息。
-
更好的评估指标和更广泛的评估:当前的评估包括AI自动评分、专家评论和有针对性的体外验证,但对系统性能的全面评估仍然处于初步阶段。
-
继承的前沿LLM的局限:LLM的局限包括不完美的事实性和幻觉,这些可能会在合作科学家系统中传播。
-
安全和伦理影响:尽管AI系统如合作科学家有潜力加速科学发现,但也带来了重大的安全和伦理挑战,需要进一步研究和缓解。
关键问题及回答