正文
2016 年 10 月,日本软银(SoftBank)领衔多家顶级风投,向一家当时还名不见经传的初创公司 Zymergen 投资总计 1.3 亿美元。在此 B 轮融资完成后,美国前任能源部长、诺奖得主朱棣文也加入了 Zymergen 董事会。
简单而言,Zymergen 是一家专注于合成生物学的美国初创公司,主要开发用于工业发酵的基因工程细菌,并结合机器学习,进行自动化分析和生物信息学处理。昨日,《Science》网站刊文首次披露这家神秘公司的创业野心以及背后的一些技术细节。
合成生物学虽然叫“生物学”,其实却与工程学理念更为接近。相比机械零件、电路元件等传统工程学科,合成生物学摆弄的生物零件更复杂、更多变。研究者通过调控相关基因通路对细胞进行“编程”,让它们像微型工厂或机器一样,生产特定产品或完成特殊任务。
传统的生物学操作方式是:提供一些有限数量的假设,由人类科学家在实验室里每个月进行 10 次测试,但现在有一种机器人每周可执行多达 1000 次实验,这相当于将效率提升了400倍。但这些机器人只能服从命令,这意味着输入正确的命令是这一过程中真正的瓶颈。
这些机器人属于 Zymergen 公司,这是一家专注于合成生物学的公司。2014年,这家公司搬进了一个位于加州旧金山湾区的废旧电子工厂。
在一大堆设备中,有一个名叫 Echo 的机械臂,它正抓起一个有着上百个装满液体的方格的塑料盒。在将塑料盒放入托盘前,Echo会对其条形码进行扫描,接下来会发生的事情,就不是人眼能看得见的了。
图丨由AI控制的机械臂正在对微生物菌群进行液移
Zymergen公司的联合创始人、分子生物学家、运营和工程副总裁Jed Dean说:“这个过程并不是手工进行移液的简单复制,而是一种完全不同的方式。”
机器人并不是使用传统的移液管吸取液体后再转移到每个方格中,而是使用每秒 500 次的声波脉冲,让液体震动并形成小液滴,这些液滴要比每次人工移液的量小数千倍。所以,机器人并不会直接接触液体。
实际上,整个流程中并没有太多未来元素,稍微有点规模的生物实验室中都在使用机器人和条形码系统。哪怕是上文提到的移液技术,这种称为“声波液移技术”(Acoustic Droplet Ejection)其实也已经存在十多年了。
图丨声波液移技术可在非物理接触情况下,实现微量液体的精准提取
然而,有意思的是,当Jed Dean被问到现在这些机器人在做什么实验时,他居然理直气壮的回答道:“我不知道。”
的确,整套实验流程都由计算机程序自行设定及操作,如果想要知道实验相关信息,只需要去电脑屏幕上看一眼就行了,何必要时时刻刻记在脑子里呢?
Zymergen公司的首席执行官Joshua Hoffman说:“整个实验过程中只有一名人类科学家参与,负责实验结果分析和事实检查。”但解读实验数据、生成假设、规划实验这类工作,Zymergen的终极目标将是“去除一切人类直觉的干扰”,实现科学实验的全过程人工智能。
图丨Zymergen公司的首席执行官Joshua Hoffman
Zymergen的做法代表了生物技术公司的一种趋势:利用人工智能来增强、甚至取代人类在科学研究中的作用,即实现“AI驱动的生物技术”。
从宏观上看,就像工厂里的生产流水线一样,科学发现也是一个循序渐进的过程:科学家们发表论文,然后指导在实验室中完成实验,进而得到全新的发现,最终又会以科学论文的形式呈现出来。这是一个标准的周期,就连当今最典型的人工智能以自动化的优势代替人力劳动也是遵循这个路线:
图丨“AI驱动的生物技术”流程图
作为上述“AI驱动的生物技术”中的重要环节,Zymergen所做的工作就是为生物燃料、塑料、药品等提供工业化的微生物配方。为了提高微生物的生产效率,客户们往往会将主力菌种直接送到Zymergen,然后由那里的机器人对每种微生物的基因进行分析和修补,从而得到一个高效版本的的工程微生物。
但问题是,那些被客户送到Zymergen的微生物已经是高度优化过的。所以说,如果要在这个基础上进一步提高效率,就只能进行更深层次的基因组研究、设计实验、分析数据。换句话说,越是要压榨出最后那点效率提升,越是要求更先进的技术手段。
图丨Zymergen的实验流程基本实现了完全自动化
那么,究竟怎样用算法来设计实验?一个原始微生物约有 5000 个基因,假设有10种可以改变给定的基因的方法,那么就有了 5 万种不同的组合。然后,可以用1000个菌株进行实验,每一个菌株都有可能突变,也许 25 个菌株就会产生足够的目标化学品。这样的菌株就可以用于下一轮实验育种,其余的菌株则放入冷冻室。
实际上,只是盲目地提高效率并不会带来科学发现上的重大进展。因为如果把所有的突变都组合成一个单一的微生物,往往不能达到“1+1>2”的效果,很有可能顾此失彼——微生物反而因此呈现出“病态”,这类病态菌株可能还不如先前未经改造的原始菌株。
因此,要选出正确的路径,这就需要一张“地图”。这张“地图”可以显示所有突变造成的影响,而且还是基于多个维度的,因为人类需要为机器学习设定一个方向。
举例而言,在合成生物学中,一条代谢通路通常拥有十几或几十个基因表达产物——有些对生产率的改善微不足道,有些却举足轻重,而代谢通路之间也经常存在交流,互相调节。想要成功制造一个工程细菌,一般要经过成百上千次的实验试错,才能一步步逼近正确答案。
在分子生物学中所提到的“代谢通路”(metabolic pathway),通常是指某个或某几个基因表达所涉及的全部酶或信号分子。细胞内这些不同代谢通路组成了代谢网络,令生物保持其内环境稳定。
然而,Zymergen的模式却完全不同,他们专门为此开发了一套机器学习系统,让人工智能技术从浩如烟海的实验数据中进行分析,指出代谢通路的要害,并根据需求找出相应的、能实现特定功能的基因表达,把这个表达写入微生物中,最后生产出所需的微生物,从而避免了繁杂的试错过程。
图丨迷宫——细胞的代谢通路汇总
但是,这里有个尴尬的问题:当机器人终于发现那些能提高产量的遗传变化时,它们对背后具体的生物化学机制一无所知。
如果实验不能加深我们对生物学原理的理解,那这真的能称为“科学”么?对于 Zymergen 的首席技术官 Aaron Kimball 来说,这个哲学观点可能并不那么重要,而且他的解释也相当直接:“能给我们带来收入的是最终结果,而不是我们是否明白其中的原理。”
到目前为止,Zymergen公司的机器人实验室将化学生产微生物的效率提高了10%以上。这个数字看起来并不起眼,但要知道,化学工业中有一些部门十分依赖微生物发酵,一点小的技术改进都有可能节省大量的成本、带来更多的收益,甚至会超过美国国家科学基金会 70 亿美元的年度预算。
机器人也许会发现那些被科学家忽略了的有益遗传变化,因为大多数能提高生产率的基因与人类所能预见的产物没有直接关系。如果没有正确的组合,一些基因可能根本无法表达。 Jed Dean说:“我已经在几种不同的微生物中看到了这种模式。如果不使用机器学习,寻找正确的基因组合就像试图破解极其复杂的密码,人类的直觉和信心很容易被问题的复杂性所压倒。”
图丨人类的直觉会增加科学研究中的不确定性?
科学研究能在多大程度上交给机器来完成,不同领域的研究人员会有不同的答案。加州大学戴维斯分校计算机科学家Ilias Tagkopoulos认为:“为了最大限度地提高信息收益,为了更接近目标,我们应该让数据决定实验步骤。”这位教授的研究领域是遗传学,在他看起来永无止境的研究课题里,包括了预测细菌如何适应不断变化的医院环境、设计出更健康的零食等诸多问题。
如果机器真的能够在某些科研任务中取代部分人类劳动,想必很多科学家都会欣然接受。与工厂工人或出租车司机不同,大多数研究科学家都希望将部分工作自动化,特别是分子和细胞生物学,其中人工移液、培养细胞、菌落数量统计等繁琐且高成本的环节尤其如此。
一名研究生的小失误可能会浪费数周的辛苦工作。更糟糕的是,为研究生设计实验的那位博士数月的努力可能也付诸东流了。
图丨高效运行中的Zymergen自动化设备
然而,人工智能为生物技术领域带来的也不全是惊喜。在尝试利用AI技术解读数据和设计实验之后,也有一些生物学家表示失望。
斯坦福大学计算生物化学家Rhiju Das的主要工作是研究分子如何折叠以设计新药。他表示,目前的机器学习方法仍然无法完成相应任务。与人类科学家相比,AI在RNA设计问题上的表现非常糟糕,这些“设计”任务似乎还是需要人类的直觉。
图丨Zymergen公司的自动化设备
此外,人工智能的“黑盒子”问题在生物技术领域似乎表现得更为突出,由 AI 控制的研究工作所取得成果将缺乏可解释性。
对此,卡内基·梅隆大学的计算机科学家Adrien Treuille提出了一个有趣的观点:我们正在离“可解释的”科学时代越来越远。研究人员不仅要依靠计算机来从事科研,而且甚至需要计算机去解释其中的原理。生物学如此复杂,而目前的AI技术又处于起步阶段,把一切都交给计算机,人类真的能放心吗?
-End-
欲知会员计划详情,请点击以上图片