专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  数据量不是问题,选对数据才是关键 ... ·  9 小时前  
爱可可-爱生活  ·  改善自编码器的可扩散性 ... ·  9 小时前  
AI前线  ·  OpenAI 前员工们大闹硅谷!离职 ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【「AI Agent 记忆」详解】首先,什么是 AI Agent-20250221082249

爱可可-爱生活  · 微博  · AI  · 2025-02-21 08:22

正文

2025-02-21 08:22

【「AI Agent 记忆」详解】
首先,什么是 AI Agent Memory?

想象一下,你正在和一个非常聪明的助手(AI Agent)聊天或者合作。为了让这个助手更好地为你工作,它需要记住一些事情,对吧? 比如:
- 你们之前聊过什么: 如果每次你问它问题,它都像第一次见面一样,那沟通效率就很低。它需要记住之前的对话,才能理解你的上下文,并给出更相关的回答。
- 它知道什么知识: 它需要知道一些通用的知识,也可能需要知道一些关于你或者特定领域的知识,才能更好地帮你解决问题。
- 它有哪些工具可以使用: 就像你有很多工具(比如笔、电脑、计算器)一样,AI Agent 也有一些“工具”(比如搜索网页、发送邮件、分析数据)。它需要知道自己有哪些工具,以及如何使用。

AI Agent Memory 就是指 AI 助手记住这些信息的能力。这段文字就是把这种“记忆”分成了几种类型,方便我们理解和设计 AI Agent。

接下来,我们逐一解读这四种记忆类型

1、情节记忆 (Episodic Memory) - 像日记一样记住“我做了什么”
- 解释: 这就像 AI Agent 的“日记”或者“个人历史记录”。 它记录了 AI Agent 过去做过的事情和与用户或其他系统的互动。比如,它记录了“用户问了我天气”,“我使用了天气查询工具”,“我回答了用户今天晴朗”。每次行动后,都会像写日记一样记录下来。
- 分析:
- 重要性: 情节记忆让 AI Agent 具备了上下文感知能力和历史追踪能力。它可以回顾过去的互动,理解对话的背景,避免重复犯错,并根据过去的经验调整未来的行为。 这对于构建对话式 AI 和需要长期互动的 Agent 非常关键。
- 存储方式 (向量数据库): 提到“向量数据库”存储“语义意义”, 这意味着不仅仅是简单地记录文字,而是理解对话的含义。向量数据库可以高效地存储和检索语义相似的信息,让 AI Agent 可以根据意思而非仅仅是关键词来回忆过去。例如,即使用户换了一种问法,Agent 也能通过语义相似性找到相关的历史对话。
- 应用场景: 聊天机器人记住之前的对话,任务型 Agent 记住执行步骤,游戏 AI 记住玩家之前的操作以便调整策略等等。

2、语义记忆 (Semantic Memory) - 像百科全书一样记住“我知道什么”
- 解释: 这就像 AI Agent 的“百科全书”或者“知识库”。它存储了 AI Agent 需要知道的通用知识、特定领域的知识,以及关于它自身的信息。就像我们知道“地球是圆的”,“巴黎是法国的首都”一样。对于 AI Agent 来说,语义记忆可能包括“我是个客服机器人”,“我的目标是帮助用户解决问题”,以及一些产品知识、行业知识等等。
- 分析:
- 重要性: 语义记忆是 AI Agent 知识的基础,让它能够理解问题、提供信息、进行推理。它类似于 RAG (Retrieval-Augmented Generation,检索增强生成) 应用中的知识库。
- 来源多样: 语义记忆可以是“内部知识”(预先编程到 Agent 中的知识),也可以是“外部知识”(从互联网或其他数据源检索到的知识)。“隔离部分互联网数据”是为了提高答案的准确性,避免 AI Agent 被海量噪声数据干扰。类似于我们人类学习时也会选择性地获取信息。
- 与 RAG 的联系: 强调了与 RAG 的相似性,说明语义记忆在提升 AI Agent 回答质量和知识覆盖面方面的重要性。 RAG 的核心思想就是利用外部知识库来增强 LLM 的能力。
- 应用场景: 问答系统,知识图谱应用,需要领域知识的专家系统,等等。

3、程序记忆 (Procedural Memory) - 像操作手册一样记住“我该怎么做”
- 解释: 这就像 AI Agent 的“操作手册”或者“规则书”。它存储了 AI Agent 运行的 系统性信息,比如:
- 系统提示 (System Prompt) 的结构: 告诉 AI Agent 它的角色、目标、行为准则等核心指令。
- 可用的工具 (Tools): AI Agent 可以使用的各种功能和插件,比如搜索工具、计算工具、API 接口等等。
- 行为准则 (Guardrails): 限制 AI Agent 行为的规则,例如“不能泄露用户隐私”,“不能生成有害内容”等等。
- 分析:
- 重要性: 程序记忆定义了 AI Agent 的 行为框架 和 能力边界。 它确保 AI Agent 能够按照预设的规则运行,并且知道自己有哪些工具可以使用。这对于构建可靠、安全、可控 的 AI Agent 非常重要。
- 存储位置 (Git, Prompt and Tool Registries): 提到 Git, Prompt and Tool Registries,说明程序记忆通常是代码化和版本控制化的。Git 用于版本管理,Prompt Registry 和 Tool Registry 用于集中管理和维护系统提示和工具信息。 这体现了软件工程化的思想,方便团队协作和系统维护。
- 系统性信息: 强调了“系统性”,说明程序记忆不是零散的信息,而是构成 AI Agent 运行基础的关键配置。
- 应用场景: 所有需要明确定义行为规范和工具使用的 AI Agent 系统,例如,电商客服机器人需要遵守服务规范,金融风控系统需要遵循风险控制规则。

4、短期/工作记忆 (Short-Term/Working Memory) - 像草稿纸一样“我现在正在用什么”
- 解释: 这就像 AI Agent 的“草稿纸”或者“大脑的 RAM”。当 AI Agent 需要完成一个任务时,它会 从长期记忆 (情节、语义、程序记忆) 中提取相关信息,并 临时存储 在这里。所有当前任务需要的信息都汇集到这里,然后 组合成一个 Prompt 发送给 LLM (大型语言模型)。LLM 根据这个 Prompt 生成下一步的行动指令。
- 分析:
- 重要性: 短期记忆是 连接长期记忆和 LLM 的桥梁。它负责 整合 来自不同长期记忆的信息,并 格式化 成 LLM 可以理解的 Prompt。Prompt 的质量直接影响 LLM 的输出质量,因此短期记忆的管理至关重要。
- 动态性: 短期记忆是 临时的,只在当前任务中有效。任务结束后,短期记忆会被清理,但长期记忆仍然保留。
- 与 Prompt 工程的关系: 强调了“编译成 Prompt”,说明短期记忆的组织和管理与 Prompt 工程密切相关。如何有效地组织信息,构建清晰的 Prompt,是提升 AI Agent 性能的关键。
- 限制 (Context Window): 虽然文本没有明确提到,但短期记忆的大小也受到 LLM 的 上下文窗口 (Context Window) 大小的限制。LLM 能够处理的 Prompt 长度是有限的,因此短期记忆的容量也受到约束。这在处理复杂任务和长期对话时可能会成为瓶颈。

总结 (Long-Term vs. Short-Term Memory)
- 长期记忆 (Long-Term Memory): 包括情节记忆、语义记忆、程序记忆 (类型 1-3)。 它们是 AI Agent 的 持久性记忆,长期存储,用于积累经验、知识和规则。 就像人类的长期记忆,存储着我们的人生经历、知识和技能。
- 短期记忆 (Short-Term Memory): 就是工作记忆 (类型 4)。 它是 临时的、动态的,用于 处理当前任务,并作为 Prompt 的构建器。就像人类的短期记忆,用于处理当前正在思考的问题。






请到「今天看啥」查看全文