抗体是免疫系统对抗感染的关键武器之一。但是产生并改进抗体的过程中涉及大量的“蛮力筛选”,耗时耗力。
生成式AI工具是否可以在此过程发挥作用?斯坦福大学的研究人员近日在Nature Biotechnology发表论文,报道了一种通用蛋白质语言模型,可以通过提示进化上的合理突变来高效地进化人类抗体,表明了生成式AI可以应用在抗体分子生成领域。
研究人员使用了蛋白质语言模型的神经网络,后者类似于ChatGPT的大型语言模型,与ChatGPT差异之处在于,蛋白质语言模型不是被输入大量的文本,而是在数千万个蛋白质序列上进行训练。
然后,在语言模型指导下,研究人员对7种抗体进行了亲和力成熟(affinity maturation),在两轮实验室进化过程中筛选了每种抗体的20个或更少的变体,并将4种有临床意义的高度成熟抗体的结合亲和力提高至7倍,将3种未成熟抗体的结合亲和力提高至160倍。提高抗体结合能力的模型也可指导不同蛋白家族和选择的高效进化,表明这些结果具有普适性。
蛋白质语言模型并不是新鲜事物。
2022年9月,华盛顿大学的生物化学家David Baker团队在Science上连发两篇论文,表示他们创造的新方法ProteinMPNN,
可以在几秒钟内设计出蛋白质,表明机器学习可用于比以前更准确、更快速地创建蛋白质分子。
2022年11月,Meta(前身为Facebook)表示,
AI能预测6亿多种蛋白质的结构,这些蛋白来自细菌、病毒和其他微生物。
这项工作只花了2周时间,而AlphaFold可能需要几分钟才能生成1个蛋白质的预测。
从预测蛋白质的结构,到设计全新的蛋白质,再到现在的辅助生成抗体,蛋白质语言模型在不断进化和发展。随着技术的不断进步和市场需求的增长,蛋白质语言模型必定有着广阔的前景和不可限量的潜力。
- 上下滑动查看参考资料 -
[1]Brian L. Hie et al. Efficient evolution of human antibodies from general protein language models. Nature Biotechnology(2023)
[2]https://www.nature.com/articles/d41586-023-01516-w
[3]J. DAUPARAS et al. Robust deep learning–based protein sequence design using ProteinMPNN. Science(2022)
[4]B. I. M. WICKY et al. Hallucinating symmetric protein assemblies. Science(2022)
[5]https://www.nature.com/articles/d41586-022-03539-1