//AI对生物学与医疗技术发展的影响
生物学可能是科学进步最有可能直接和明确地提高人类生活质量的领域。在上个世纪,一些最古老的人类疾病(如天花)终于被征服了,但还有更多的疾病仍然存在,战胜它们将是一项巨大的人道主义成就。除了治愈疾病之外,生物科学原则上还可以通过延长健康的人类寿命、增加对自身生物过程的控制和自由以及解决我们目前认为是人类状况中不变部分的日常问题来提高人类健康的基线质量。
在上一节的“限制因素”语言中,将智能直接应用于生物学的主要挑战是数据、物理世界的速度和内在复杂性(事实上,这三者都是相互关联的)。当涉及临床试验时,人为限制也会发挥作用。让我们一一来看。
对细胞、动物甚至化学过程的实验都受到物理世界速度的限制:许多生物方案涉及培养细菌或其他细胞,或者只是等待化学反应发生,这有时可能需要几天甚至几周,而且没有明显的方法来加快速度。动物实验可能需要数月(或更长时间),而人体实验通常需要数年(长期结果研究甚至数十年)。与此相关的是,数据往往是缺乏的——不是数量太多,而是质量:总是缺乏清晰、明确的数据,这些数据将感兴趣的生物效应与正在发生的其他 10,000 种令人困惑的事情隔离开来,或者因果干预给定过程,或者直接衡量某些影响(而不是以某种间接或嘈杂的方式推断其后果)。即使是大量的定量分子数据,比如我在研究质谱技术时收集的蛋白质组学数据,也会产生嘈杂和遗漏很多(这些蛋白质在哪些类型的细胞中?细胞的哪个部分?在细胞周期的哪个阶段?
造成这些数据这些问题的部分原因是内在的复杂性:如果你曾经见过一张显示人类新陈代谢生物化学的图表,你就会知道很难分离这个复杂系统任何部分的影响,更难以精确或可预测的方式干预系统。最后,除了在人体上运行实验所需的内在时间之外,实际的临床试验还涉及大量的官僚主义和监管要求,(在包括我在内的许多人看来)增加了不必要的额外时间并延迟了进展。
鉴于这一切,许多生物学家长期以来一直对人工智能和更普遍的“大数据”在生物学中的价值持怀疑态度。从历史上看,在过去 30 年中将他们的技能应用于生物学的数学家、计算机科学家和物理学家已经取得了相当大的成功,但并没有产生最初希望的真正变革性影响。一些怀疑已经被 AlphaFold(当之无愧地为其创造者赢得诺贝尔化学奖)和 AlphaProteo 11 等重大革命性突破所减少,但人们仍然认为 AI 在有限的情况下(并将继续)有用。一个常见的表述是“AI 可以更好地分析您的数据,但它无法生成更多数据或提高数据质量。垃圾进,垃圾出”。
但我认为这种悲观的观点是对 AI 的思考是错误的。如果我们关于 AI 进展的核心假设是正确的,那么将 AI 视为一种数据分析方法的正确方式不是作为一种数据分析方法,而是作为执行生物学家所做的所有任务的虚拟生物学家,包括在现实世界中设计和运行实验(通过控制实验室机器人或简单地告诉人类要运行哪些实验——就像首席研究员对他们的研究生所做的那样), 发明新的生物方法或测量技术,等等。正是通过加快整个研究过程,AI 才能真正加速生物学。我想重复一遍,因为这是我在谈论 AI 改变生物学的能力时出现的最常见的误解:我不是在谈论 AI 仅仅作为分析数据的工具。根据本文开头对强大 AI 的定义,我谈论的是使用 AI 来执行、指导和改进生物学家所做的几乎所有事情。
为了更具体地说明我认为加速可能来自哪里,令人惊讶的是,生物学进步的很大一部分来自真正极少数的发现,这些发现通常与广泛的测量工具或技术有关,这些工具或技术 12 允许对生物系统进行精确但通用或可编程的干预。这些重大发现每年可能有 ~1 个,它们共同可以说推动了 >50% 的生物学进步。这些发现之所以如此强大,正是因为它们打破了内在的复杂性和数据限制,直接增加了我们对生物过程的理解和控制。每十年的几项发现使我们对生物学的大部分基本科学理解成为可能,并推动了许多最强大的医学治疗。
一些示例包括:
CRISPR:一种允许对生物体中的任何基因进行实时编辑的技术(用任何其他任意序列替换任何任意基因序列)。自从最初的技术开发出来以来,针对特定细胞类型的不断改进,提高了准确性,减少了错误基因的编辑——所有这些都是人类安全使用所必需的。
用于精确观察正在发生的事情的各种显微镜:高级光学显微镜(采用各种荧光技术、特殊光学元件等)、电子显微镜、原子力显微镜等。
基因组测序和合成,在过去几十年中,成本下降了几个数量级。
光遗传学技术,允许您通过照射神经元来激发神经元。
mRNA 疫苗原则上允许我们设计针对任何事物的疫苗,然后快速适应它(mRNA 疫苗当然在 COVID 期间出名)。
CAR-T 等细胞疗法允许将免疫细胞从体内取出并“重新编程”,原则上可以攻击任何东西。
概念见解,如疾病的细菌理论或实现免疫系统与癌症 13 之间的联系。
我不厌其烦地列出所有这些技术,因为我想对它们做出一个关键的声明:我认为如果有更多有才华、有创造力的研究人员,它们的发现率可以提高 10 倍或更多。或者,换句话说,我认为这些发现对智能的回报很高,而生物学和医学中的其他一切都主要来自它们。
我为什么这么想?因为当我们试图确定 “回归智能” 时,我们应该养成一些问题的答案。首先,这些发现通常是由少数研究人员做出的,通常是同一个人重复进行的,这表明需要技巧而不是随机搜索(后者可能表明冗长的实验是限制因素)。其次,它们通常“可能比实际时间早几年制造”:例如,CRISPR 是自 80 年代以来就已知的细菌免疫系统中天然存在的成分,但又过了 25 年,人们才意识到它可以重新用于一般基因编辑。由于缺乏科学界对有希望的方向的支持,它们也经常被推迟很多年(参见 mRNA 疫苗发明者的简介;类似的故事比比皆是)。第三,成功的项目往往是杂乱无章的,或者是人们最初认为没有希望的事后想法,而不是大量资助的努力。这表明,推动发现的不仅仅是大量的资源集中,还有独创性。
最后,尽管其中一些发现具有“序列依赖性”(你需要先进行发现 A 才能拥有进行发现 B 的工具或知识)——这再次可能会造成实验延迟——但许多(也许大多数)是独立的,这意味着许多可以同时进行。这些事实,以及我作为生物学家的一般经验,都强烈地向我表明,如果科学家更聪明,更善于在人类拥有的大量生物知识之间建立联系,那么有数百个这样的发现等待着我去发现(再次考虑 CRISPR 的例子)。尽管几十年来精心设计的物理建模,但 AlphaFold/AlphaProteo 在解决重要问题方面取得了成功,比人类更有效地解决了重要问题,这提供了一个原理证明(尽管在狭窄的领域中使用了一个狭窄的工具),应该为前进指明方向。
因此,我猜测强大的人工智能至少可以使这些发现的速度增加 10 倍,从而在 5-10 年内为我们提供未来 50-100 年的生物进步。 14 为什么不是 100 倍?也许这是可能的,但在这里,序列依赖性和实验时间都变得很重要:在 1 年内取得 100 年的进步需要很多事情第一次就做对,包括动物实验以及设计显微镜或昂贵的实验室设施等。实际上,我对我们可以在 5-10 年内获得 1000 年的进步的想法持开放态度(也许听起来很荒谬),但对我们能否在 1 年内获得 100 年持怀疑态度。另一种说法是,我认为存在一个不可避免的恒定延迟:实验和硬件设计具有一定的“延迟”,需要迭代一定的“不可简化”次数,才能学习到无法逻辑推断的东西。但在此之上,大规模并行可能是可能的 15 。
临床试验呢?尽管有很多官僚主义和与它们相关的缓慢,但事实是,它们的缓慢程度很大一部分(尽管绝不是全部!)最终源于需要严格评估几乎不起作用或模棱两可的药物。可悲的是,当今的大多数疗法都是如此:平均抗癌药物可以将生存率提高几个月,同时具有需要仔细测量的显着副作用(阿尔茨海默病药物也有类似的情况)。这导致了大量的研究(为了获得统计能力)和艰难的权衡,监管机构通常不擅长做出这些权衡,这也是因为官僚主义和利益争夺的复杂性。
当某件事运作得非常好时,它会进行得更快:有一个加速的批准轨道,当效应量更大时,批准起来的难度会大得多。用于 COVID 的 mRNA 疫苗在 9 个月内获得批准,比通常的速度要快得多。也就是说,即使在这些情况下,临床试验仍然太慢——mRNA 疫苗可以说应该在 ~2 个月内获得批准。但是,这些类型的延迟(药物端到端 ~1 年)与大规模并行化以及需要一些但不是太多的迭代(“几次尝试”)与 5-10 年的根本性转变非常兼容。更乐观的是,人工智能支持的生物科学可能会通过开发更好的动物和细胞实验模型(甚至模拟)来减少临床试验中迭代的需求,这些模型可以更准确地预测人类会发生什么。这对于开发对抗衰老过程的药物尤为重要,衰老过程会持续数十年,我们需要更快的迭代循环。
最后,关于临床试验和社会障碍的话题,值得明确指出的是,与其他一些技术 16 相比,在某些方面,生物医学创新在成功部署方面有着异常强大的记录。正如引言中提到的,尽管技术上运行良好,但许多技术受到社会因素的阻碍。这可能表明人们对 AI 可以完成的工作持悲观态度。但生物医学的独特之处在于,尽管开发药物的过程过于繁琐,但一旦开发出来,它们通常会被成功部署和使用。
综上所述,我的基本预测是,人工智能驱动的生物学和医学将使我们能够将人类生物学家在未来 50-100 年内取得的进步压缩到 5-10 年。我将这称为“压缩的 21 世纪”:在强大的 AI 开发出来之后,我们将在几年内取得整个 21 世纪在生物学和医学方面取得的所有进步。
尽管预测强大的 AI 在几年内能做什么本质上仍然很困难且具有推测性,但要问“未来 100 年人类在没有帮助的情况下能做什么”是有一定具体意义的。简单地看看我们在 20 世纪取得的成就,或者从 21 世纪的前 2 个十年推断,或者问“10 个 CRISPR 和 50 个 CAR-T”会给我们带来什么,都提供了实用、扎实的方法来估计我们可能期望从强大的 AI 中获得的一般进步水平。
下面我尝试列出我们可能期待的内容。这并不是基于任何严格的方法,而且几乎肯定会在细节上被证明是错误的,但它试图跨越我们应该预料到的激进主义的一般水平:
可靠地预防和治疗几乎所有 17 自然传染病。鉴于 20 世纪对抗传染病的巨大进步,想象我们可以在压缩的 21 世纪或多或少地“完成工作”并不激进。mRNA 疫苗和类似技术已经为“任何事物的疫苗”指明了方向。传染病是否从世界上完全根除(而不是仅在某些地方)取决于有关贫困和不平等的问题,这些问题将在第 3 节中讨论。
消除大多数癌症。在过去的几十年里,癌症死亡率每年下降 ~2%;因此,按照当前人类科学的速度,我们正走在 21 世纪消除大多数癌症的轨道上。一些亚型已经基本治愈(例如,使用 CAR-T 疗法的某些类型的白血病),我可能对针对婴儿期癌症并防止其生长的极具选择性的药物感到兴奋。AI 还将使治疗方案非常精细地适应癌症的个体化基因组成为可能——这些在今天是可能的,但在时间和人类专业知识方面非常昂贵,AI 应该允许我们扩展。死亡率和发病率似乎有可能降低 95% 或更多。也就是说,癌症具有极多的多样性和适应性,并且可能是这些疾病中最难完全摧毁的。如果各种罕见的、难治的恶性肿瘤持续存在,也就不足为奇了。
对遗传病的非常有效的预防和治愈。大大改进的胚胎筛选可能会使预防大多数遗传病成为可能,并且一些更安全、更可靠的 CRISPR 后代可能会治愈现有人群的大多数遗传病。然而,影响大部分细胞的全身疾病可能是最后的阻碍。
预防阿尔茨海默病。我们很难弄清楚导致阿尔茨海默病的原因(它与 β-淀粉样蛋白有某种关系,但实际细节似乎非常复杂)。这似乎正是可以用更好的测量工具来解决的问题类型,这些工具可以隔离生物效应;因此,我看好 AI 解决它的能力。一旦我们真正了解了正在发生的事情,它很有可能最终可以通过相对简单的干预措施来预防。也就是说,已经存在的阿尔茨海默病造成的损害可能很难逆转。
改进了大多数其他疾病的治疗。这是其他疾病的统称类别,包括糖尿病、肥胖症、心脏病、自身免疫性疾病等。其中大多数似乎比癌症和阿尔茨海默氏症“更容易”解决,而且在许多情况下已经急剧下降。例如,心脏病死亡人数已经下降了 50% 以上,而 GLP-1 激动剂等简单的干预措施已经在对抗肥胖和糖尿病方面取得了巨大进展。
生物自由度。过去 70 年的特点是节育、生育、体重管理等方面的进步。但我怀疑人工智能加速的生物学将大大扩展可能性:体重、外表、繁殖和其他生物过程将完全由人类控制。我们将在生物自由的标题下提到这些:每个人都应该被赋予选择自己想成为的人并以最吸引他们的方式生活的想法。当然,会有关于全球获取平等的重要问题;有关这些内容,请参见第 3 节。
人类寿命 18 翻倍 .这似乎很激进,但预期寿命在 20 世纪增加了近 2 倍(从 ~40 岁增加到 ~75 岁),因此“压缩的 21 世纪”会再次翻倍达到 150 岁是“趋势”。显然,减缓实际衰老过程所涉及的干预措施将与上个世纪为防止(主要是儿童)疾病过早死亡所需的干预措施不同,但变化的幅度并非史无前例 19 。具体来说,已经有药物可以将大鼠的最大寿命延长 25-50%,而不良影响有限。而一些动物(例如某些类型的海龟)已经活了 200 岁,所以人类显然没有处于某个理论上限。据猜测,需要的最重要的东西可能是可靠的、非 Goodhart 的人类衰老生物标志物,因为这将允许实验和临床试验的快速迭代。一旦人类的寿命达到 150 岁,我们或许能够达到“逃逸速度”,争取到足够的时间,让大多数今天活着的人都能活多久就活多久,尽管肯定不能保证这在生物学上是可能的。
值得查看此列表并反思如果从现在起 7-12 年后实现所有这些目标,世界将会有多大不同(这将符合激进的 AI 时间表)。毋庸置疑,这将是一场难以想象的人道主义胜利,一下子消除了困扰人类数千年的大多数灾祸。我的许多朋友和同事都在抚养孩子,当这些孩子长大后,我希望任何提到疾病的事情对他们来说都会像坏血病、天花或腺鼠疫对我们来说一样。这一代人也将受益于增加的生物自由和自我表达,如果幸运的话,他们也可能能够想活多久就活多久。
很难高估这些变化对每个人来说是多么令人惊讶,除了一小群期待强大 AI 的人。例如,美国数以千计的经济学家和政策专家目前正在争论如何保持社会保障和医疗保险的偿付能力,以及更广泛地说如何降低医疗保健成本(医疗保健主要由 70 岁以上的人消费,尤其是患有癌症等绝症的人)。如果这一切成为现实 20 ,这些计划的情况可能会得到根本性的改善,因为工作年龄与退休人口的比例将发生巨大变化。毫无疑问,这些挑战将被其他挑战所取代,例如如何确保广泛获得新技术,但值得反思的是,即使生物学是唯一成功被人工智能加速的领域,世界也会发生多大的变化。