【「AI Agent 记忆」详解】首先，什么是 AI Agent-20250221082249_爱可可-爱生活的专栏文章_微信文章

【「AI Agent 记忆」详解】
首先，什么是 AI Agent Memory？

想象一下，你正在和一个非常聪明的助手（AI Agent）聊天或者合作。为了让这个助手更好地为你工作，它需要记住一些事情，对吧？比如：
- 你们之前聊过什么: 如果每次你问它问题，它都像第一次见面一样，那沟通效率就很低。它需要记住之前的对话，才能理解你的上下文，并给出更相关的回答。
- 它知道什么知识: 它需要知道一些通用的知识，也可能需要知道一些关于你或者特定领域的知识，才能更好地帮你解决问题。
- 它有哪些工具可以使用: 就像你有很多工具（比如笔、电脑、计算器）一样，AI Agent 也有一些“工具”(比如搜索网页、发送邮件、分析数据)。它需要知道自己有哪些工具，以及如何使用。

AI Agent Memory 就是指 AI 助手记住这些信息的能力。这段文字就是把这种“记忆”分成了几种类型，方便我们理解和设计 AI Agent。

接下来，我们逐一解读这四种记忆类型

1、情节记忆 (Episodic Memory) - 像日记一样记住“我做了什么”
- 解释: 这就像 AI Agent 的“日记”或者“个人历史记录”。它记录了 AI Agent 过去做过的事情和与用户或其他系统的互动。比如，它记录了“用户问了我天气”，“我使用了天气查询工具”，“我回答了用户今天晴朗”。每次行动后，都会像写日记一样记录下来。
- 分析:
- 重要性: 情节记忆让 AI Agent 具备了上下文感知能力和历史追踪能力。它可以回顾过去的互动，理解对话的背景，避免重复犯错，并根据过去的经验调整未来的行为。这对于构建对话式 AI 和需要长期互动的 Agent 非常关键。
- 存储方式 (向量数据库): 提到“向量数据库”存储“语义意义”，这意味着不仅仅是简单地记录文字，而是理解对话的含义。向量数据库可以高效地存储和检索语义相似的信息，让 AI Agent 可以根据意思而非仅仅是关键词来回忆过去。例如，即使用户换了一种问法，Agent 也能通过语义相似性找到相关的历史对话。
- 应用场景: 聊天机器人记住之前的对话，任务型 Agent 记住执行步骤，游戏 AI 记住玩家之前的操作以便调整策略等等。

2、语义记忆 (Semantic Memory) - 像百科全书一样记住“我知道什么”
- 解释: 这就像 AI Agent 的“百科全书”或者“知识库”。它存储了 AI Agent 需要知道的通用知识、特定领域的知识，以及关于它自身的信息。就像我们知道“地球是圆的”，“巴黎是法国的首都”一样。对于 AI Agent 来说，语义记忆可能包括“我是个客服机器人”，“我的目标是帮助用户解决问题”，以及一些产品知识、行业知识等等。
- 分析:
- 重要性: 语义记忆是 AI Agent 知识的基础，让它能够理解问题、提供信息、进行推理。它类似于 RAG (Retrieval-Augmented Generation，检索增强生成) 应用中的知识库。
- 来源多样: 语义记忆可以是“内部知识”(预先编程到 Agent 中的知识)，也可以是“外部知识”(从互联网或其他数据源检索到的知识)。“隔离部分互联网数据”是为了提高答案的准确性，避免 AI Agent 被海量噪声数据干扰。类似于我们人类学习时也会选择性地获取信息。
- 与 RAG 的联系: 强调了与 RAG 的相似性，说明语义记忆在提升 AI Agent 回答质量和知识覆盖面方面的重要性。 RAG 的核心思想就是利用外部知识库来增强 LLM 的能力。
- 应用场景: 问答系统，知识图谱应用，需要领域知识的专家系统，等等。

3、程序记忆 (Procedural Memory) - 像操作手册一样记住“我该怎么做”
- 解释: 这就像 AI Agent 的“操作手册”或者“规则书”。它存储了 AI Agent 运行的系统性信息，比如：
- 系统提示 (System Prompt) 的结构: 告诉 AI Agent 它的角色、目标、行为准则等核心指令。
- 可用的工具 (Tools): AI Agent 可以使用的各种功能和插件，比如搜索工具、计算工具、API 接口等等。
- 行为准则 (Guardrails): 限制 AI Agent 行为的规则，例如“不能泄露用户隐私”，“不能生成有害内容”等等。
- 分析:
- 重要性: 程序记忆定义了 AI Agent 的行为框架和能力边界。它确保 AI Agent 能够按照预设的规则运行，并且知道自己有哪些工具可以使用。这对于构建可靠、安全、可控的 AI Agent 非常重要。
- 存储位置 (Git, Prompt and Tool Registries): 提到 Git, Prompt and Tool Registries，说明程序记忆通常是代码化和版本控制化的。Git 用于版本管理，Prompt Registry 和 Tool Registry 用于集中管理和维护系统提示和工具信息。这体现了软件工程化的思想，方便团队协作和系统维护。
- 系统性信息: 强调了“系统性”，说明程序记忆不是零散的信息，而是构成 AI Agent 运行基础的关键配置。
- 应用场景: 所有需要明确定义行为规范和工具使用的 AI Agent 系统，例如，电商客服机器人需要遵守服务规范，金融风控系统需要遵循风险控制规则。

4、短期/工作记忆 (Short-Term/Working Memory) - 像草稿纸一样“我现在正在用什么”
- 解释: 这就像 AI Agent 的“草稿纸”或者“大脑的 RAM”。当 AI Agent 需要完成一个任务时，它会从长期记忆 (情节、语义、程序记忆) 中提取相关信息，并临时存储在这里。所有当前任务需要的信息都汇集到这里，然后组合成一个 Prompt 发送给 LLM (大型语言模型)。LLM 根据这个 Prompt 生成下一步的行动指令。
- 分析:
- 重要性: 短期记忆是连接长期记忆和 LLM 的桥梁。它负责整合来自不同长期记忆的信息，并格式化成 LLM 可以理解的 Prompt。Prompt 的质量直接影响 LLM 的输出质量，因此短期记忆的管理至关重要。
- 动态性: 短期记忆是临时的，只在当前任务中有效。任务结束后，短期记忆会被清理，但长期记忆仍然保留。
- 与 Prompt 工程的关系: 强调了“编译成 Prompt”，说明短期记忆的组织和管理与 Prompt 工程密切相关。如何有效地组织信息，构建清晰的 Prompt，是提升 AI Agent 性能的关键。
- 限制 (Context Window): 虽然文本没有明确提到，但短期记忆的大小也受到 LLM 的上下文窗口 (Context Window) 大小的限制。LLM 能够处理的 Prompt 长度是有限的，因此短期记忆的容量也受到约束。这在处理复杂任务和长期对话时可能会成为瓶颈。

总结 (Long-Term vs. Short-Term Memory)
- 长期记忆 (Long-Term Memory): 包括情节记忆、语义记忆、程序记忆 (类型 1-3)。它们是 AI Agent 的持久性记忆，长期存储，用于积累经验、知识和规则。就像人类的长期记忆，存储着我们的人生经历、知识和技能。
- 短期记忆 (Short-Term Memory): 就是工作记忆 (类型 4)。它是临时的、动态的，用于处理当前任务，并作为 Prompt 的构建器。就像人类的短期记忆，用于处理当前正在思考的问题。

【「AI Agent 记忆」详解】首先，什么是 AI Agent-20250221082249

正文

2025-02-21 08:22
本条微博链接

请到「今天看啥」查看全文