使用Tool Use扩大Agent能力边界，更灵活也更智能

DataFunTalk · 公众号 · · 2024-09-01 13:00

正文

吴恩达曾在演讲中分享了关于AI Agent的四种设计模式：Reflection (反思)、Tool Use (工具使用)、Planning (规划) 和Multi-agent Collaboration (多智能体协作)。

今天我们重点看看工具使用 (Tool Use) 这种设计模式。

工具使用 (Tool Use) 是Agent工作流的关键设计模式，它赋予了大模型通过请求调用各种函数来收集信息、采取行动或操作数据的能力。这里所说调用的外部工具或系统，可以是API、数据库或是搜索引擎等等。

吴恩达的演讲中也推荐大家阅读这篇论文：

Efficient Tool Use with Chain-of-Abstraction Reasoning

论文地址：https://arxiv.org/pdf/2401.17464.pdf

这篇论文里提出了一种新的方法——抽象链 (COA)，通过训练大模型先解码带有抽象占位符的推理链，然后调用领域工具，填写特定的知识使每个推理链具体化，以此使大模型可以学习更通用的推理策略。

这些推理策略可以更好地适应不断变化的领域知识，同时大模型还可以并行执行解码和调用外部工具，大大降低了等待工具响应而引发的推理延迟。

为了更方便地理解上述设计，我们来看论文中的这张图：

这是COA方法的示意图。最上面绿色部分是给定的领域知识，蓝色部分是针对大模型微调后生成的多步骤的推理链。橙色部分就是今天的重点，调用外部工具，使用特定领域知识来使推理链具体化。最后的黄色部分就是基于推理链得到的最终答案。

论文中也表示，COA方法可以使模型回答的准确率及速度都有明显的提升。

由此我们可以看到，通过Tool Use的设计模式，Agent可以突破自身能力的限制，实现更复杂的任务执行以及更广泛的功能覆盖。

与此同时，Tool Use也使得Agent更加灵活和智能，可以根据不同的任务需求和环境变化来调用合适的工具。

那如何在具体的业务中，通过使用Tool Use的方法来应对Agent的复杂查询和多步骤任务处理的挑战呢？

据了解，58同城AI Lab大模型算法工程师曾禹飞所在的团队，他们探索并设计了RAG与Tool Use相结合的智能体开发方案，实现了知识和操作的双重优化。同时也优化了检索算法和工具调用的能力，高效整合RAG与Tool Use，最终使Agent能够快速获取信息并执行操作。在具体的应用场景中，任务完成率和系统性能均得到了明显的提升。

DataFun有幸邀请到了58同城AI Lab大模型算法工程师曾禹飞老师，他将在DataFunSummit2024: 生成式 AI 技术峰会的【AI Agent落地实践】论坛上分享他们具体的技术实践和避坑指南，希望能给你的团队带来启发。

使用Tool Use扩大Agent能力边界，更灵活也更智能

正文

请到「今天看啥」查看全文