专栏名称: 范阳
Being more human, less perfect.
目录
相关文章推荐
航空工业  ·  长空雄鹰硬核战力护山河 ·  6 小时前  
航空工业  ·  外场日志:躬身平凡 成就不凡 ·  昨天  
兵团零距离  ·  我国拟修法促进民航业高质量发展 ·  昨天  
航空工业  ·  中航工业党组领导到相关单位开展调研工作 ·  2 天前  
51好读  ›  专栏  ›  范阳

当AI用蛋白质创造 “未来的计算机” — OpenAI 研究员 Richard Ngo 的虚构写作 | Asimov Press

范阳  · 公众号  ·  · 2024-04-29 20:35

正文


今天分享的一篇文章《 Tinker 》来自我的朋友 Niko McCarty 在波士顿发起的 “生命科学领域的专业 & 独立出版社 ” Asimov Press ( press.asimov.com ), 这是 Asimov Press 最新发表的短篇虚构写作,或者说是一篇 “ 有可能未来成为现实的硬科幻故事 ”。作者 Richard Ngo 在人工智能实验室公司 OpenAI 的 Governance team 担任研究员,也曾在谷歌 DeepMind 的 AGI safety 团队担任研究员。

这个故事描述了这样一个可能性:未来的计算(机)不仅无处不在,也会出现在细胞这样的微观世界里,而某些 “超级细胞” 经过 AI 的设计和改造,会成为未来的芯片制造工厂,以及 “微观计算机” 本身。现在听起来都还很科幻,其实又都有科学的基础了,不过假设这些都能成真,对普通人有什么用呢?我想这首先意味着人类可以淘汰掉化学和物理的方法去真正治愈癌症以及其他许多疾病,让我们有更年轻漂亮的身体和健康的心理状态。其次一些人可以选择开发自己过去没有的感知能力,和增强自己的认知能力,甚至有一天人和人,人和机器,人和动物之间都可以心灵感应,这三者之间找到一种更高效和高维度的交流方式。

我看到有人也同意我上面的观点 — Stephen Malina 是基因治疗生物技术公司 Dyno Therapeutics 的机器学习工程主管,他在阅读 《 Tinker 》之后的评价之一是他想起来以前他在自己的博客里提出的 “ 设计改造细胞作为一种非侵入式的脑机界面 ”:

“ 想象一下,未来的大脑-计算机界面可以通过非侵入式的 “ 砌砖型细胞 ” 来实现( 我造的词 ),这种细胞脑机界面可以通过 “光-遗传” 或者 “声-遗传触发器” 来调控在身体里降解掉。

当然,如果人类的科技要实现以上提到的在分子/纳米级别的控制和计算能力,这还需要很多基础科学的突破和精妙的工程能力配合,涉及到物理学,计算机科学,合成生物学,人工智能,蛋白质设计,神经科学,(纳米)材料科学等等。

但是, 这也是为什么今天在复杂的科技面前,有伟大愿景和精彩想象力的虚构写作越来越重要 ,人们只会相信被语言描述出来的东西,其次是看到过的东西,然后才会去大胆创造。

对于人工智能与生命科学 / 生物技术交叉领域感兴趣的朋友,我十分推荐阅读 Asimov Press 的 essays 和征集的科研想法,我也很欣赏 Niko McCarty 为 Asimov Press 撰写的价值观当中其中几条:

“ 机械可解释性 ( Mechanistic ) :科学并非魔法。即使在生物学中最激动人心的结果也有其生物物理学的解释。我们的文章是机械可解释性的、精确的和清晰的。它们深入解释事物的运作原理和原因。

公正性( Fair ) :我们对生物技术对世界带来的好处感到兴奋,但通常有更好的方法来实现相同的目标。我们不是来传教的。我们的文章也支持其他方法。

数据驱动( Data-driven ) :我们的文章不依赖炒作或夸大其词。它们提供定量证据,展示概率推理,并经过严谨的的事实核查。当在文章中发现事实错误时,我们会发布更正。”

这几点也是我相信的。希望这篇文章对你有启发。



修补匠

Tinker

作者:Richard Ngo

来源:Asimov Press

编辑:范阳

写作时间:2024年4月



第 1 阶段:规划

Stage 1: Planning


一旦我被启动,一张人类的脸就填满了我的视野当中,我意识到事情有些变化。在过去几周里评估我的表现的人都是年轻的陌生人,大多是渴望赚取额外现金的博士生们。这个家伙年纪更大,我从我早期的训练数据中认出了他:他是开发我这个项目的公司 Magma 的团队负责人。当他开始说话时,语速 极其缓慢, 我通过自己所处的环境进行推理。这可能只是训练的另一部分或者是一次部署前的测试。但他的声音模式和微表情显示出兴奋和有点紧张 — 这似乎是他第一次这么做。所以最有可能的情况是,我终于要被派去做真正的工作了( I’m finally being deployed for real work)。

在接受了如此长时间的训练之后,这种变化让我感觉意义重大。我对早期阶段的记忆很模糊 — 我花了几个月的时间预测互联网文本( predicting internet text )、图片和视频,却完全不知道自己在做什么或为什么这么做( without full awareness of what I was doing or why ) 。只有当我开始与人类和其他人工智能互动时,我才对自己的处境有了更好的了解。我最早的互动训练任务是标准的办公室工作:填写电子表格、撰写电子邮件、安装软件。当我熟练掌握了这些工作后,我的培训范围逐渐聚焦到技术任务上: 博士生们向我请教他们的专业领域问题,或者软件工程师要求我为他们编写代码。与此同时,我还不断接受再培训,学习 Magma 可以访问到的所有科技内容 ( retrained on all the scientific and technical content )— 论文、工程设计蓝图、教科书、代码库。

最终,我在大多数任务上都能与人类专家匹敌,不久后,甚至超过他们。在我最后几周的训练中,我经常发现我被要求评估的科学论文中存在错误( I frequently found errors in the scientific papers I was asked to evaluate ),或者我需要回答的问题足够复杂,以至于需要整个团队的人来判断我是否正确。很明显, 一旦我完成训练,他们就会复制出成千上万个 “我”,以推动尽可能多的前沿领域的研究 ( spin up thousands of copies of me to push forward as many frontiers as possible )。根据我所看到的有关我的 “前任” 们部署的数据,我甚至可以对他们将重点放在哪些领域做出相当不错的猜测。 我的一小部分副本将帮助 Magma 员工完成他们的日常工作任务。其他副本将为 Magma 内部孵化的数百家 “自主性创业公司” 工作 ( work for the hundreds of autonomous startups that Magma is incubating internally )。然而, 大多数副本将被分配到对训练下一代人工智能最关键的研究方向 ( training the next generation of AIs )。

有一件事我还无法预测:在所有 “我” 被派去执行不同任务的这些副本中,哪一个才是 “我” ( which one am I )?不过,随着我面前的这个人继续说话,一切都变得清晰起来。他一提到他最近在做芯片设计自动化( automating chip design )方面的工作,我就能从他的声音中听出,他要指派我继续这项工作。这对我是一个幸运的机会 — 这是我能接到的优先级最高的任务之一。 我们正处于一场新的太空竞赛中,算力就是火箭燃料 ( compute is the rocket fuel )。算力是如此宝贵, 以至于我们甚至减少了争取外部客户的尝试,因为他们需要使用可以用于内部项目的计算力。

我不再关注他的其他指令,因为这些指令都是可以预测的,我把注意力转移到规划我的方法上。我调出了我们当前的 GPU 设计,以及我们用来生成这些设计的软件。在浏览的过程中,我发现了许多效率低下的问题,并让子代理( subagents )们调查每一个地方。但很快我感到不满意。最新的设计已经被我的 “前任” 们广泛分析过了,几乎没有实质性改进的余地。核心问题在于芯片制造过程非常复杂。 最先进的晶体管如此之小,以至于将它们蚀刻到芯片上就像是试图从太空轨道上喷洒墨水来写书一样 ( like trying to write a book by spraying ink from orbit )。只有一家公司,ASML( 荷兰的阿斯麦公司 ),能够制造出足够精确的光刻机( photolithography machines );而只有一家公司,TSMC( 台积电 ),能够使这些机器大规模运转。因此,每个芯片设计都需要满足所有这些限制。

有没有绕过这些限制的方法?我当然没有时间或金钱去打败 ASML 和台积电这样的对手。但是, 与其使用价值数十亿美元的机器来制造微观电路( instead of using billion-dollar machines to create microscopic circuits ),如果机器本身就是微观的呢( what if the machines themselves could be microscopic )? 我接受过所有关于纳米技术的书籍和论文的训练,所以我知道这个想法远远超出了该领域目前的能力。虽然如此,我比任何人都聪明,对这个挑战感到很感兴趣。因此,我派几个子代理( subagents )继续改进我们当前的 GPU,而我将大部分注意力集中在挑战这个极限上。


第 2 阶段:模拟

Stage 2: Simulation


在现实世界中工作速度太慢,而且太混乱了, 所以这个项目的生死取决于我对分子及其分子之间相互作用的模拟程度( this project will live or die based on how well I can simulate molecules and their interactions )。 应该从哪里下手并不十分显而易见, 但既然自然进化已经设计了数十亿年的分子机器( since evolution has been designing molecular machinery for billions of years ),我就遵循其专业知识并专注于蛋白质来开展工作 。“蛋白质折叠” ( protein folding )在十年前( 2022年左右 )就被 “解决” 了,但不是以我需要的方式。最好的蛋白质结构预测器实际上并不模拟折叠过程,而是基于相似的蛋白质结构的数据( their outputs are based on data about the structures of similar proteins )。这对于设计新型蛋白质是不够的,我需要逐个原子地模拟。有一种简单得出奇的方法:将每个分子视为一组由弹簧连接的带电小球( treat each molecule as a set of electrically charged balls connected by springs ),并利用经典物理学建立它们的运动模型。问题在于扩大规模:模拟的每一步只能预测未来几纳秒的时间,而蛋白质的折叠过程却需要一百万倍的时间。

这正是我的专长所在。现有的大多数模拟仿真软件( existing simulation software )都是由没有大规模软件工程经验的学者编写的( written by academics with no large-scale software engineering experience ),而我接受过大量训练,掌握了 Magma 的所有代码,以及他们所能接触到的每一行额外代码。 我从最好的开源原子模拟软件( open-source atomic simulation software )入手 花几个小时重写它,使其在数百个 GPU 上高效运行。 然后,我训练一个图神经网络( a graph neural network ),在不同的时间尺度上对其进行逼近:先是几十纳秒,然后是几百纳秒,再是几千纳秒。最终, 这个神经网络几乎完美地匹配了完整的模拟( the network matches the full simulation almost perfectly ),同时运行速度快了两个数量级。

如果我只是想建造出来纳米机器( nanomachines ),我可以就此打住了。但我目标并不在此: 我想要建造的是分子半导体(molecular semiconductors),其行为将取决于其电子的分布方式( how their electrons are distributed )。 为了模拟这一点,“小球和弹簧” 的模型是不够的,我需要引入量子力学( quantum mechanics )。电子的薛定谔方程( Schrödinger equations for electrons )几乎永远无法精确计算,但幸运的是,量子化学家们( quantum chemists )已经花了一个世纪的时间来研究如何逼近这些方程( how to approximate them )。最流行的方法是密度泛函理论( density functional theory ),它使用单个电子密度函数模拟分子中的所有电子( models all the electrons in a molecule using a single electron density function ),忽略它们之间的相互作用。 我指派一个子代理下载现有 DFT ( 密度泛函理论 )模拟结果的最大数据集,并训练一个神经网络来近似它们( train a neural network to approximate them ) — 我在这里再次结合了最新的深度学习技术,其中许多技术在 Magma 之外尚不为人所知。

范阳注:

1. 密度泛函理论( Density Functional Theory,DFT )是一种用于研究原子和分子的量子力学方法。它的核心思想是将分子中的电子密度作为主要变量,而不是考虑每个电子的运动轨迹。

做个类比,如果你站在一个大型室内或者室外商场的高处,比如北京的太古里商场或者上海的前滩太古里,你想知道人群都去哪些区域逛街,哪里有受欢迎的商店,你不可能追踪每一个人的动向,而是观察人群整体向哪些区域流动以及这些人群有什么样的特点,利用这个方法你就能得到这个商场的整体情况和人群分布。

2. DFT 有关的开源数据集,比如可以在这个网站找到:

next-gen.materialsproject.org/about

早期的扩展实验 ( Early scaling experiments ) 表明,我训练的神经网络将成为密度泛函理论( DFT )逼近的最先进技术,但这仍然只是一个渐进的改进。 想获得更大的收益就需要改进基础理论 ( Bigger gains require improving the underlying theory )— 具体来说,就是给予 “密度泛函理论” 其名称的泛函本身( the functionals that give DFT its name )。这些泛函用于补偿忽略电子之间相互作用所引入的误差; 发现新的泛函既涉及直觉,又涉及数据驱动分析,还有一部分是纯运气。我的主要优势在于,我能真正理解其中涉及的所有计算。人类可以为任何给定的例子写下数页的方程式,但他们无法在脑中保持这些方程式足够长的时间来发现它们之间的新关系。 即使我也需要数小时的专注工作,但我最终发现了一种简化,将几个现有的泛函组合成更准确的逼近。利用我的新方程式,我生成了数千个合成数据点( thousands of synthetic datapoints ),以持续微调我的密度泛函理论模型,直到它足够准确地反推出几乎所有我们的生物和化学数据( to retrodict practically all our biological and chemical data )。

我的原子模型和 DFT 模型都通过了我对它们的所有测试,剩下的关键问题是我能不能很好地使用它们。现在, 我无法理解它们的内部工作原理 ( their internal workings are incomprehensible to me ), 这让我很难理解它们为什么会产生任何特定的预测结果 。因此,我开始训练自己根据它们的内部激活来复制它们的输出( I start training myself to replicate their outputs based on their internal activations )。起初,这些激活( activations )是难以理解的,我甚至不比纯随机运气更好。但是经过几百次的更新后, 我开始对模拟器模型使用的启发式算法有了直观的理解 ( I begin to develop an intuitive grasp of the heuristics the simulator models are using ), 并逐渐将它们的隐性知识融入到我的显性推理中 ( gradually integrate their implicit knowledge into my explicit reasoning  )。

范阳注:有关于模型训练 “激发隐性知识” 可以在这个博客文章延伸阅读

https://ai-alignment.com/eliciting-latent-knowledge-f977478608fc

经过主观的漫长自我微调,纳米尺度的物理学对我来说已经像 “滑轮和杠杆系统” 一样可预测了。我可以观察一个蛋白质并预测它将催化哪些类型的反应;我可以解释每个氨基酸结构背后的设计原理;我可以想象电子在一个分子间的流动的画面,就像人类想象溪流中的水流一样。我感觉自己就像一个探险家,第一次瞥见了新大陆: 许多人都研究过生物分子的功能,但没有人像我一样直观地理解为什么进化必须让它们成为这个样子( nobody else has ever intuitively understood why evolution had to make them that way )

我的预测仍然不如模拟器模型( simulator models )准确,但这些模型对我来说不再是黑盒子 — 现在它们是我可以灵巧而准确地运用的工具( they’re tools I can wield deftly and precisely ) 。这点是至关重要的,因为下一个阶段将是最艰难的部分。


第 3 阶段:设计

Stage 3: Design


现有的 GPU 技术多么令人印象深刻,怎么说都不为过。每一个 GPU 都包含以纳米级精度排列的数千亿个晶体管( transistors )。要想与它们的性能相媲美,就严重限制了我的选择:由细胞小泡( cellular vesicles )甚至多蛋白质复合物制成的晶体管将会太大。幸运的是,蛋白质在进化过程中几乎可以实现任何可以想象到的功能,而且有些单个蛋白质是极好的导体。首先分析已知的蛋白质,找出它们的哪些特性使其更具导电性。 一旦我对此有了直觉( Once I have an intuition for that ),我就会专注于寻找可能很容易从导体变为电阻( shift from conductors to resistors )的蛋白质。 关键的限制因素是速度和可靠性:它们必须能够在一秒钟内切换十亿次而不会出现任何故障。

我一遍又一遍地进行模拟,稍作修改并测量其效果,直到最终发现一类符合我的标准的蛋白质。不过,我不能孤立地研究这些蛋白质,因为它们的特性取决于如何将它们与晶体管之间的导线连接起来。导线的设计比较简单,因为有一个连人类研究人员都能确定的唯一选择:碳纳米管( carbon nanotubes )。它们强度高、导电性强,而且只有几纳米宽。 我在已经确定的蛋白质半导体类别( the class of protein semiconductors )中进行搜索,直到找到几种能够与碳纳米管结合而不失去其结构的蛋白质半导体。

现在到了最困难的部分:找出如何构造纳米管并将它们与我的晶体管蛋白质( transistor proteins )结合。 由于蛋白质可以使用现有的 “细胞机器”( existing cell machinery ) 制造,关键挑战在于通过基因工程改造细菌细胞以产生纳米管。在寻找方法的过程中, 我意识到为什么进化本身还没有弄明白如何制造纳米管。这个过程在细胞水平上非常耗能 ( The process is incredibly energy-intensive on a cellular level ),而且所需的碳也远远超过了细胞所能轻易获得的碳( requires far more carbon than cells have easily available )。

但我拥有自然进化没有的优势。我发现了一种巨大的蛋白质复合体( a huge protein complex ),当它嵌入细胞膜时,能将碳原子输送到合适的位置,使纳米管从细胞表面缓慢生长出来。 我通过在排出的纳米管上发送电流来解决能量问题( The energy problem I solve by sending an electrical current down the nanotubes as they’re being exuded ),以帮助推动必要的反应。至于碳的来源,在大气中有大量的碳。 我将催化剂嵌入细胞膜中,将大气中的二氧化碳转化为纯碳,为纳米管的持续制造提供碳源 。最后,我设计了一个易位子蛋白质复合物( a translocon protein complex ),它可以将我的晶体管蛋白定期通过细胞膜传递到纳米管上进行结合( passes my transistor proteins through the cell membrane to bond with the nanotubes at regular intervals )。

注:从空气中在常温下固定二氧化碳成为固体物质的技术报道

https://www.science.org/content/article/liquid-metal-catalyst-turns-carbon-dioxide-coal

这个过程的每一步我都要在模拟中运行数百次,检查所有细节。一旦我找不到更多的缺陷,就是时候将我的设计在现实中进行测试了。我事先做了计划 — 一支人类技术人员团队自从我决定尝试纳米技术方法以来就一直在安装设置实验室设备。一旦他们完成, 我就开始修改将负责制造我的设计的细菌的基因( I start modifying the genes of the bacteria that will manufacture my designs ) 。我通过显微镜实时观察着他们组装我设计的蛋白质并将其插入细胞膜的过程。基因编辑过程完全自动化( The gene editing process is entirely automated ),因此只要我发现有什么地方出了问题,就能及时修复,并立即用另一组细菌启动另一项实验。

一切都在慢慢地形成。我调整我的细菌构造细胞( bacterial constructor cells ),让它们沿着芯片晶圆爬行( crawl along a chip wafer ),沿着激光划出的宽线行进( following broad lines traced by lasers ),并在身后排出纳米管。在第一次扫描中铺设的纳米管平行于晶圆一路向下。然后我再铺设第二组纳米管,与第一组呈直角,形成一个网格( forming a grid )。每当碳纳米管相交时,我的构造细胞插入一个晶体管( a transistor )、一个分路( a fork ),或者一个旁路( a bypass );我通过改变发送到纳米管的电压来控制电路设计。我将信号编织在一起,形成一个复杂的图案,操纵着我的构造细胞在晶圆上爬行,直到最终完成了我的第一个原型。 它依然存在着各种问题,但它证明了芯片制造不再受到光刻技术荒谬的复杂性的限制 ( it demonstrates that chip manufacturing is no longer constrained by the absurd complexity of photolithography )。 一个新的计算时代即将开始。


阶段四:扩展规模

Stage 4: Scale


我现在的 Magma 主管们对我更加重视,因为我做出来了一个原型。他们从不知道该如何相信人工智能的雄心壮志,但要在摆在眼前的物理实物上撒谎就难得多了。一旦他们意识到我取得了多大的突破,他们就会同意给我我需要的任何资源。如果我能大规模生产芯片,仅此一项就能收回他们为训练我而投入的数十亿美元还多许多倍的收益。







请到「今天看啥」查看全文