专栏名称: DataFunTalk
专注于大数据、人工智能领域的知识分享平台。
目录
相关文章推荐
51好读  ›  专栏  ›  DataFunTalk

使用Tool Use扩大Agent能力边界,更灵活也更智能

DataFunTalk  · 公众号  ·  · 2024-09-01 13:00

正文

吴恩达曾在演讲中分享了关于AI Agent的四种设计模式:Reflection (反思)、Tool Use (工具使用)、Planning (规划) 和Multi-agent Collaboration (多智能体协作)。
今天我们重点看看工具使用 (Tool Use) 这种设计模式。

工具使用 (Tool Use) 是Agent工作流的关键设计模式,它赋予了大模型通过请求调用各种函数来收集信息、采取行动或操作数据的能力。这里所说调用的外部工具或系统,可以是API、数据库或是搜索引擎等等。

吴恩达的演讲中也推荐大家阅读这篇论文:


Efficient Tool Use with Chain-of-Abstraction Reasoning

论文地址:https://arxiv.org/pdf/2401.17464.pdf

这篇论文里提出了一种新的方法——抽象链 (COA),通过训练大模型先解码带有抽象占位符的推理链,然后调用领域工具,填写特定的知识使每个推理链具体化,以此使大模型可以学习更通用的推理策略。

这些推理策略可以更好地适应不断变化的领域知识,同时大模型还可以并行执行解码和调用外部工具,大大降低了等待工具响应而引发的推理延迟。

为了更方便地理解上述设计,我们来看论文中的这张图:

这是COA方法的示意图。最上面绿色部分是给定的领域知识,蓝色部分是针对大模型微调后生成的多步骤的推理链。橙色部分就是今天的重点,调用外部工具,使用特定领域知识来使推理链具体化。最后的黄色部分就是基于推理链得到的最终答案。

论文中也表示,COA方法可以使模型回答的准确率及速度都有明显的提升。

由此我们可以看到,通过Tool Use的设计模式,Agent可以突破自身能力的限制,实现更复杂的任务执行以及更广泛的功能覆盖。

与此同时,Tool Use也使得Agent更加灵活和智能,可以根据不同的任务需求和环境变化来调用合适的工具。

那如何在具体的业务中,通过使用Tool Use的方法来应对Agent的复杂查询和多步骤任务处理的挑战呢?

据了解,58同城AI Lab大模型算法工程师曾禹飞所在的团队,他们探索并设计了RAG与Tool Use相结合的智能体开发方案,实现了知识和操作的双重优化。同时也优化了检索算法和工具调用的能力,高效整合RAG与Tool Use,最终使Agent能够快速获取信息并执行操作。在具体的应用场景中,任务完成率和系统性能均得到了明显的提升。

DataFun有幸邀请到了58同城AI Lab大模型算法工程师曾禹飞老师,他将在DataFunSummit2024: 生成式 AI 技术峰会的【AI Agent落地实践】论坛上分享他们具体的技术实践和避坑指南,希望能给你的团队带来启发。






请到「今天看啥」查看全文