“利用进化技术开发新的蛋白质和生物分子,造福人类”——这一愿景是Heidelberg团队开始这个iGEM项目的初心。在调研过程中,他们遇到了一种令人兴奋的方法,即基于噬菌体辅助的持续进化(PACE),该方法由哈佛大学的Kevin Esvelt和David Liu于2011年发明。这种方法背后的想法很简单:模拟生物反应器中的自然进化,加速并引导它朝着一个特定的目标前进。更准确地说,PACE (phage-assisted continuous evolution)实现了一个完全封闭、极快的进化周期,包括复制、突变和选择,以实现蛋白质的体内定向进化:待进化的蛋白质由M13噬菌体编码,并通过噬菌体复制和繁殖从一个大肠杆菌宿主细胞转移到下一个宿主细胞;大肠杆菌宿主表达突变基因以提高复制过程中噬菌体的突变率,从而形成高度多样的基因库;最后,大肠杆菌宿主细胞中的合成电路通过控制噬菌体基因的表达,将噬菌体的繁殖效率与待进化蛋白质的适应性(即功能)结合起来。
2017 Heidelberg 团队确定了当前进化速度设置的两个主要限制因素:
1. 它需要一个复杂的、定制的生物反应器,包括复杂的流量控制装置,由于多个故障点(潜在的噬菌体污染;如果流速太高,噬菌体被冲出的风险;宿主细胞生物膜的形成适当的噬菌体进化),这对反应器的组装和运行都具有挑战性。
2. PACE几乎完全局限于改善已有的蛋白质功能。要进化出真正新颖的功能,就需要进化作为垫脚石,到目前为止,只有缓慢地适应选择压力,才能创造出进化的垫脚石。实际上,这意味着进化出的新功能需要一个极其复杂的实验装置,该装置包括微调多个合成的选择电路,这些电路在许多天内按顺序应用。然而在大多数情况下,从零开始开发一个新的功能仍然是一项几乎不可能按进度实现的任务。
由于其复杂性和各种故障点,直到今天,全球只有三个实验小组完成了PACE这项工作。Heidelberg队伍和这三个小组保持联系并且听取了他们的建议,这对于项目的成功进展有很重要的意义。
本项目的工作目标是使蛋白质的体内定向进化更快、更容易、并扩大其应用范围。我们设想的主要创新应用是新型酶的体内定向进化,这将对不同行业(如化学/制药生产、生物材料生产等)产生巨大的影响,但对于传统的定向进化或合理的工程战略仍然具有挑战性。为了实现这个目标,必须抛弃现有的模式,重新思考定向进化的概念。因此,Heidelberg队伍提出了一个新颖的、高度创新的工程概念:通过将速度与蛋白质序列-功能关系的深度学习相结合,在体内和硅片上进行交互进化。这个概念背后的想法是使用智能算法快速向前定向进化。更准确地说,队伍的算法使他们能够通过硅片,具有新的、目标功能的预进化蛋白质,从而跳过在定向体内进化过程中所需的进化踏脚石。
为了实现目标,Heidelberg队伍采用的工程方法是,首先将进化问题划分为基本组成部分,分别独立地解决,经过验证之后将它们组合成一个统一的工作流程。体内和硅片上定向进化系统所需的一般成分在概念上是相同的,由包含三个主要步骤的封闭循环组成:
1. 繁殖
2. 突变
3. 序列变体的选择
1. 在无选择压力和诱变的情况下,在大肠杆菌宿主细胞上繁殖噬菌体
2. 在大肠杆菌中过度表达诱变基因,并调查由于诱变诱导的遗传漂移而自发形成的抗性菌落;
将噬菌体的繁殖与已知的转基因“适应性”在相应的合成电路上进行比较。最后,我们成功地将这三个步骤结合到一个完整的速度周期中,以进化出改进的分离T7聚合酶变体。
除此之外,Heidelberg队伍设计了一个名为 AiGEM的创新软件套件,用于模拟遗传进化的人工智能软件。AiGEM核心功能与典型定向进化周期的各个步骤精确对应:
1. 我们使用遗传人工智能算法GAIA对亲本序列进行变异,该算法在亲本蛋白质序列/序列池中引入随机错误(注意,错误也可以限制在选定的序列窗口中)
2. 我们使用DeeProin选择序列,DeeProin是一个在1000万个代表800多个蛋白质类的蛋白质序列上创建和训练的深层神经网络。DeeProin能够从原始序列数据有力地推断序列功能关系。反过来,GAIA将DeeProin分析转化为一个遗传适应度评分,并应用一个阈值来选择存活序列变异。
3. 简单地通过在硅片进化轮中使用先前的进化序列变体开始新的计算循环来实现复制。重要的是,作为我们综合人类实践活动的一部分,我们在我们的硅内进化软件中增加了第四步,在体内定向进化世界中没有对应的软件:
4. 我们创建了SafetyNet,一个基于DeeProin的Web应用程序来推断“睡眠”危害任何亲代(和进化)序列。因此,安全网保护定向进化过程,监控并避免有害或危险蛋白质序列的无意进化。
PREDCEL (Phage-related discontinuous evolution)
利用我们从噬菌体辅助持续进化(PACE)中采用的与噬菌体相关的不连续进化(PREDCEL)方法,我们希望使世界各地的科学家能够轻松地改进各种不同的蛋白质,以适用于无数的应用场景。
从本质上讲,PREDCEL将整个步伐的复杂性降低到简单、标准的实验室程序,同时获得了在单个进化轮之间交换条件(菌株、诱导剂等)的灵活性。本项目还提供了一个光遗传学工具,以便在PREDCEL运行期间简单地适应选择压力。
为了验证PREDCEL方法,Heidelberg队伍对分裂的T7聚合物进行定向进化,以改进自动重组(即分裂域的蛋白质相互作用),完成了所需的各项基础实验,勾勒出一个简单完整的定向进化酶的工作流程。这个工作流程的关键是MAWS2.0,一个最初由IGEM团队Heidelberg 2015引入的软件,支持适体和相应的核糖开关的硅片设计。该团队成功地设计和验证了一种利用工程细胞色素C来检测体外合成的有机硅产品的核糖开关,从而证明了改进的MAWS 2.0软件的功能。这些核糖开关随后被用于检测所需的反应产物,并在控制进化过程中调节选择压力,表达对M13噬菌体繁殖至关重要的M13基因。
利用AiGEM介导的硅进化与Predcel介导的体内进化相结合的改良酶和新酶工程的完全可概括的工作流程
Heidelberg 2017队伍通过引入创新的体内和硅进化界面作为合成生物学的新工程范例,提供了一个基础性的进展:首先通过实施一个独特的体内-硅进化周期,大大加速了蛋白质的定向进化过程;同时,项目项目提供了标准化PREDCEL协议、PREDCEL部件收集、在线工具箱指南和随附的RFC集成化的工具箱交付给最终用户,并用实验结果指导工具箱的使用,验证工具箱的功能。Heidelberg队伍的iGEM传承做的非常好,2017的这个项目无论从立意还是wiki风格等方面都继承了Heidelberg队伍的严谨逻辑性和“集成工具箱”风格,实验数据和软件功能两方面的内容相辅相成,是整个项目中十分出彩的一笔。