一周前,在Meta如火如荼地卷文生视频赛道的时候,那个被它解散的蛋白质团队EvolutionaryScale获得了超1.42亿美元的种子轮融资,
这个融资额在整个生物技术领域都可以说是高得离谱
。
去年八月,Meta官宣旗下的蛋白质折叠团队Meta-FAIR解散。这个纯粹的“科学+AI”项目并不能让Meta快速获得收益,
Meta专注商业化AI的决定看似也是情理之中
。
然而,
这个不被看好的团队竟用仅仅一年的时间就打了Meta的脸
。他们最新推出的ESM3被认为是生物学领域具有里程碑意义的生成式AI模型,为生物学编程开创了新的可能性。
1.项目名称
:
EvolutionaryScale
开发用于创造新型蛋白质和其他生物系统的大型语言模型——ESM,
目前已迭代到ESM-3
。
-
首席科学家:Alexander Rives (纽约大学计算机科学博士、前Facebook AI科学家)
-
-
2024年6月25日完成了高达1.42亿美元的种子轮融资。本次融资由Nat Friedman和Daniel Gross以及Lux Capital领投,亚马逊、NVentures(英伟达的风险投资部门)和天使投资人参投。
人工智能的进步为生物科学研究创造了前所未有的机会,包括设计功能性生物分子,尤其是蛋白质。将人工智能运用于蛋
白质设计,
不仅可以提升蛋白质设计的效率及成功率
,还通过快速应对传染病爆发等方式,来
帮助人类解决一些正在面临的挑战
。
Alexander Rives等人正是看到了蛋白质设计方面的缺口,决定开发基于深度学习的大模型,
从而推动产业级蛋白质设计进入“全自动智能生成时代”
。
于是,EvolutionaryScale应运而生。
它是一家专注于生物科学领域的前沿AI研究实验室
,致力于推出生物学前沿的语言大模型。
有意思的是,
该公司创始团队的八位成员全都来自于Meta的FAIR(基础人工智能研究)部门
。尽管在世界级的社交媒介巨头那里吃了瘪,但初始团队的核心人员都没有放弃,反而快速地投入新战地,
开始在原有团队成果的基础上开发下一代模型
。
EvolutionaryScale的大模型支持健康、环境科学等领域的研究与开发,不停探索生物学的扩展性,为突破性的科学研究提供动力。
其中最显著的成果就是蛋白质折叠技术的突破
,ESM模型揭示了数亿个宏基因组蛋白质的结构,帮助世界各地的科学家来模拟和理解蛋白质。
EvolutionaryScale旨在通过开放、安全的研究方式,来指导蛋白质设计领域的人工智能技术开发
。
在此基础上,该公司作为签署方,引领了超160位来自学术界、政府以及民间的全球利益相关者,共同发展这项技术,确保其安全可靠,从而达成造福人类健康和社会的愿景。
正是由于怀着引领生物学界先进AI技术的责任感,Alexander Rives和他的团队从未停止脚步。
此前,EvolutionaryScale曾发布过大型语言模型ESM1,
这被认为是第一个用于蛋白质的transformer语言模型
,由EvolutionaryScale的创始团队在Meta的FAIR部门工作期间所构建。作为ESM1升级模型的ESM2拥有1500万个参数,并且相较于旧模型ESM1b(拥有6.5亿个参数)表现更佳。
上周,EvolutionaryScale发布了最新的ESM3 AI模型,这是朝着生物学的未来所迈进的一大步。凭借这种模型的能力,有可能会加速广泛应用的发现,有利于创造有助于捕获碳的蛋白质,
从而开发出新的癌症治疗方法
。
ESM3是一个生成式的AI模型,
主要功能是生成新型蛋白质
。该模型通过深度学习技术,使用大量的蛋白质数据进行训练,从而学习蛋白质的序列、结构和功能之间的关系。
ESM3的训练使用了超过1万亿teraflops的计算能力
,这是目前已知生物学领域中最大的计算规模。
它在地球上自然多样性的27.8亿种蛋白质数据集上进行了训练,使其能够同时对蛋白质的序列、结构和功能进行推理。
-
数据收集与处理:EvolutionaryScale首先会从各种来源收集大量的生物学数据,包括基因序列、蛋白质结构、功能注释等。这些数据会经过清洗、标准化和格式化处理,以便于后续的分析和应用。
-
模型训练:使用深度学习算法和大量的计算资源,EvolutionaryScale会对处理后的数据进行训练,构建出能够理解和预测生物学规律的大型语言模型。这些模型不仅具有高度的准确性,还能够处理复杂的生物学问题。
-
生成新蛋白质:通过交互式提示,ESM3能够生成新的蛋白质,这些蛋白质可能在自然界中需要数亿年才能进化出来。
-
科学验证:生成的新型蛋白质将通过科学实验进行验证,以确定其功能和潜在应用。
目前,
ESM3最引人注目的使用案例之一是生成了一种新的绿色荧光蛋白(GFP)
。
GFP是自然界中最美丽和独特的蛋白质之一,负责水母的发光和珊瑚的鲜艳荧光色。ESM3通过一系列思考过程,跨越了5亿年的进化,创造了这种新的荧光蛋白。
这一过程在自然进化中可能需要超过5亿年
,而ESM3通过计算方法实现了这一飞跃
。
ESM3的发布也为药物发现和合成生物学领域带来了革命性的变化
。
在药物发现方面,
ESM3能够生成具有特定生物活性的新型蛋白质
,为药物筛选和优化提供了更多的候选分子。同时,ESM3还能够预测和优化药物与靶点的相互作用机制,为药物的设计和开发提供更加科学的依据。
在合成生物学方面,
ESM3能够生成具有特定功能的生物系统
,为生物制造和生物能源等领域提供了新的解决方案。
例如,ESM3可以生成出将二氧化碳高效转化为有机物的酶系统,为碳捕获和利用提供了新的途径。
EvolutionaryScale的ESM3模型代表了AI在生物学领域的新里程碑。通过其强大的生成能力和与行业领导者的合作,ESM3有望加速新型蛋白质的发现和生物系统的设计,
为未来的药物开发、材料科学和环境科学等领域带来革命性的影响
。
合成生物学是EvolutionaryScale未来发展的一个重要方向
。
通过设计和合成新的基因电路和生物路径等方式,科学家们可以创建具有特定功能的生物体。
-
基因电路类似于电子电路,但它们在细胞中控制生物学过程。
基因电路能够在细胞内实现对特定基因表达的精确控制。例如,可以设计一个基因电路,使其在细胞检测到特定信号(如某种化学物质或环境变化)时启动或关闭特定基因的表达。
-
合成生物路径涉及多种酶和代谢途径的组合,用于生产有价值的化合物。
通过AI分析和设计,科学家可以创建新的代谢途径,使生物体能够合成天然条件下无法产生的化合物。例如,通过重新设计微生物的代谢路径,微生物可以生产出医药中间体、生物燃料或工业化学品。
-
细胞工厂是通过基因工程手段改造微生物,使其在工业条件下高效生产目标产品的生物系统。
通过AI辅助设计,科学家可以改造微生物的基因组,使其在特定条件下表现出优异的生产性能。例如,通过编辑酵母或细菌的基因,科学家可以使这些微生物高效生产抗生素、酶或其他生物制品。
若此项技术能继续发展,不仅将推动科学研究的前沿发展,
还能为医药、环境保护和农业等领域带来重要的应用前景
。
EvolutionaryScale正通过AI和大数据分析技术推动个性化医疗的进步,
为患者提供更加精准和高效的医疗服务
。
个性化医疗是基于每个患者的独特生物学信息和临床数据,量身定制最合适的治疗方案。其中一个关键领域是基因组分析。通过对患者的基因组进行全面测序和分析,科学家可以识别出与疾病相关的基因变异。
EvolutionaryScale利用AI技术,
快速准确地解析大量基因组数据
,从中发现潜在的疾病风险因素。
这种方法可以帮助医生在疾病的早期阶段做出诊断,并采取预防措施。例如,通过分析乳腺癌患者的BRCA1和BRCA2基因突变,
可以预测其患病风险
,从而进行早