专栏名称: PaperWeekly

PaperWeekly是一个分享知识和交流学问的学术组织，关注的领域是自然语言处理的各个方向。我们热爱知识，分享知识，希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。

GPT还是DeepSeek？不如全都要！南洋理工、IDEA等提出首个多智能体系统LLM Routing框架

PaperWeekly · 公众号 · 科研 · 2025-02-21 22:02

正文

独木不成林，随着基于大型语言模型（LLM）的智能体（agents）的发展，人们愈发意识到单个 LLM 和 Agent 的局限性。受到人类团队分工协作的启发，将多个 LLM 驱动的智能体组合成一个团队，能够更有效地解决复杂问题。然而，使用多智能体系统进行推理时，你是否遇到过这样的问题：

模型选择困难症，大模型“杀鸡用牛刀”，小模型效果一言难尽？
针对各类问题设计智能体协作模式和角色分工而绞尽脑汁？
想动态调配 LLM 资源，却不知如何平衡性能与成本？

别担心！多智能体界的“调度员”来了！由 IDEA 联手同济大学、武汉大学、南洋理工大学团队提出的 MasRouter ，首次将 协作模式选择 、 角色分配 和 大语言模型调度 整合成智能路由框架，为每个任务定制最佳智能体团队！

相关论文

论文标题：

MasRouter: Learning to Route LLMs for Multi-Agent Systems

论文链接：

https://arxiv.org/abs/2502.11133

代码链接：

https://github.com/yanweiyue/masrouter

背景介绍

考虑这样的两个编程问题：

编写 python 代码统计字符串的长度
从后端数据库到前端网页全面实现一个视频网站

很显然，上面两个任务的复杂度天差地别，前者只需要一个最简单的 LLM 便能很好解决，使用大且复杂的模型会造成不必要的开销；而后者则需要最先进的模型和复杂的多智能体分工、检查和迭代优化。

类似的情况在生活中经常出现，大模型多如牛毛，推理方法更是浩如烟海，如何选择合适的 LLM、协作模式以平衡效果和开销，是一个巨大的挑战。

近年来，在单智能体领域，已经有许多有效的 LLM routing 方案为不同问题动态选择 LLM。然而，单智能体能力有限，当我们希望用多智能体系统解决复杂问题时，依然会陷入选择困难症。

传统的 LLM 路由方法主要针对单智能体场景，无法应对多智能体系统中的新问题：1）如何确定多智能体协作模式；2）如何为不同的智能体分配个性化角色；3）如何为不同智能体分配合适的 LLM，实现异构多智能体系统推理。

▲ 单智能体和多智能体路由的流程对比

为解决这些挑战，本文首先明确定义了 Multi-agent routing 任务，随后提出了第一个多智能体系统路由框架—— MasRouter ，为每个任务定制最佳智能体团队，让 GPT 和 Deepseek 在多智能体系统中并肩作战！

多智能体系统路由

▲ MASR 的定义

本文中，我们首先明确定义了多智能体系统路由问题。多智能体系统路由（MASR）的本质是一个函数映射，将每个查询映射到最合适的 LLM、协作模式和角色分配，以构建一个高效且经济的多智能体系统。其中协作/推理模式是骨架，确定了多智能体系统推理的基本流程；而角色分工是器官，决定了每个智能体的具体任务和职责；LLM 调度则是血液，为每个智能体提供动力。

理想的 MASR 方法将为每个查询定制最佳的协作模式、角色分工和 LLM，各司其职各得其所，使得整个系统能够给出正确且经济的解答。拒绝“杀鸡用牛刀”，也拒绝“以卵击石”。

MasRouter

提出多智能体系统路由（MASR）任务后，我们设计了第一个 MASR 框架——MasRouter，该框架实现了协作模式选择、角色分配和 LLM 调度的一体化。MasRouter 的核心是一个三阶段的多智能体系统路由器，包括协作模式决断器、角色分配器和 LLM 调度器，通过三个模块能得到生成某问题正确答案的概率：

方法的整体流程如下图所示：

▲ MasRouter 算法框架

4 .1 协作模式选择

MasRouter 首先根据任务的复杂性和领域，选择合适的协作模式。例如，对于软件开发任务，可能需要一个包含需求分析、算法设计、代码开发和测试的层次化工作流；对于某个复杂的数学问题，可能需要多轮检查反思工作流。由于协作模式和查询之间的关系通常很难明确表征，MasRouter 使用变分潜在变量模型来捕捉查询与协作模式之间的语义关联，从而选择最合适的协作模式：