Manus 背后用的 CodeAct的架构介绍↓
大型语言模型 (LLM) 代理能够执行广泛的操作,例如调用工具和控制机器人,在应对现实世界的挑战方面表现出巨大的潜力。LLM 代理通常通过生成 JSON 或预定义格式的文本来提示执行操作,这通常受到受限的操作空间(例如,预定义工具的范围)和受限的灵活性(例如,无法组合多个工具)的限制。
这项工作提出使用可执行的 Python 代码将 LLM 代理的操作合并到统一的操作空间 (CodeAct) 中。与 Python 解释器集成后,CodeAct 可以执行代码操作并动态修改先前的操作或通过多轮交互根据新的观察发出新操作。
我们对 API-Bank 上的 17 个 LLM 和新策划的基准进行了广泛的分析,结果表明 CodeAct 优于广泛使用的替代方案(成功率高出 20%)。CodeAct 令人鼓舞的性能促使我们构建一个开源 LLM 代理,它通过执行可解释的代码与环境交互并使用自然语言与用户协作。
相关论文;arxiv.org/abs/2402.01030
#ai生活指南# #程序员# #科技#
大型语言模型 (LLM) 代理能够执行广泛的操作,例如调用工具和控制机器人,在应对现实世界的挑战方面表现出巨大的潜力。LLM 代理通常通过生成 JSON 或预定义格式的文本来提示执行操作,这通常受到受限的操作空间(例如,预定义工具的范围)和受限的灵活性(例如,无法组合多个工具)的限制。
这项工作提出使用可执行的 Python 代码将 LLM 代理的操作合并到统一的操作空间 (CodeAct) 中。与 Python 解释器集成后,CodeAct 可以执行代码操作并动态修改先前的操作或通过多轮交互根据新的观察发出新操作。
我们对 API-Bank 上的 17 个 LLM 和新策划的基准进行了广泛的分析,结果表明 CodeAct 优于广泛使用的替代方案(成功率高出 20%)。CodeAct 令人鼓舞的性能促使我们构建一个开源 LLM 代理,它通过执行可解释的代码与环境交互并使用自然语言与用户协作。
相关论文;arxiv.org/abs/2402.01030
#ai生活指南# #程序员# #科技#