记忆工作原理
- 为智能体指定记忆文件路径:创建智能体时,通过
memory=参数传递文件路径。后端控制这些文件的存储位置和访问权限。 - 智能体在启动时加载记忆:每次对话开始时,智能体将记忆文件内容读入系统提示词。
- 智能体在对话过程中更新记忆:当智能体学习到新信息时,会使用内置的
edit_file工具更新记忆文件。更改会被持久化,并在下次对话中可用。
智能体作用域记忆
为智能体提供一个共享的记忆文件,所有用户都可以读取和写入。随着智能体在每次对话中积累知识,它会随时间不断改进。当拥有写入权限时,它还可以学习和更新技能。参见技能作为程序性记忆。 关键在于后端命名空间:将其设置为(assistant_id,) 意味着该智能体的每次对话都读写同一个记忆文件。
用户作用域记忆
为每个用户提供其专属的记忆文件。智能体可以记住每位用户的偏好、上下文和历史记录,而核心智能体指令保持不变。如果存储在用户作用域的后端中,用户还可以拥有专属的技能。 命名空间使用(user_id,),因此每个用户都获得一个隔离的记忆文件副本。用户 A 的偏好永远不会泄露到用户 B 的对话中。
高级用法
以上部分涵盖了基础知识:配置记忆路径、选择作用域,然后让智能体处理其余部分。本节介绍更高级的模式。情景记忆
情景记忆存储过去经历的记录:发生了什么、顺序如何以及结果是什么。与语义记忆(存储在AGENTS.md 等文件中的事实和偏好)不同,情景记忆保留了完整的对话上下文,使智能体能够回忆如何解决问题,而不仅仅是从中学到了什么。
Deep Agents 通过检查点免费获得情景记忆:每次对话都作为检查点线程持久保存。为了使过去的对话可搜索,可以将线程搜索包装在一个工具中。user_id 从运行时上下文中获取,而不是作为参数传递:
技能作为程序性记忆
技能是程序性记忆的一种形式:可重用的指令,告诉智能体如何执行任务。与语义记忆(事实)或情景记忆(经历)不同,程序性记忆编码了智能体可以按需应用的逐步能力。 技能可以是:- 只读(开发者定义):开发者编写技能,智能体使用它们但不能修改。这是最常见的模式。
- 读写(智能体学习):智能体根据经验创建和更新技能。当智能体拥有记忆的写入权限时,它也可以写入其技能目录。使用策略钩子来控制哪些路径可写。
skills= 参数传递技能。技能是按需加载的,而不是注入到每个提示词中,从而在需要能力之前保持上下文简洁:
组织级记忆
组织级记忆遵循与用户作用域记忆相同的模式,但使用共享命名空间而不是每个用户的命名空间。将其用于应适用于所有用户和智能体的策略或知识。 组织记忆通常是只读的,以防止通过共享状态进行提示词注入。有关详细信息,请参阅只读与可写记忆。后台整合
默认情况下,智能体在对话期间写入记忆(热路径)。另一种方法是在对话之间作为后台任务处理记忆,有时称为休眠时间计算。一个独立的深度智能体审查最近的对话,提取关键事实,并将其与现有记忆合并。| 方法 | 优点 | 缺点 |
|---|---|---|
| 热路径(对话期间) | 记忆立即可用,对用户透明 | 增加延迟,智能体必须多任务处理 |
| 后台(对话之间) | 无用户侧延迟,可以跨多个对话综合 | 记忆直到下次对话才可用,需要第二个智能体 |
整合智能体
整合智能体读取最近的对话历史,并将关键事实合并到记忆存储中。在langgraph.json 中将其与你的主智能体一起注册:
consolidation_agent.py
langgraph.json
Cron
一个cron 任务按固定计划运行整合智能体。智能体搜索所有最近的对话,并将其综合到记忆中。 使用 cron 任务调度整合智能体:所有 cron 计划都基于 UTC 时间解释。有关管理和删除 cron 任务的详细信息,请参阅cron 任务。
计划运行
使用after_seconds 参数在每次对话后调度运行。这是活动驱动的:只有当用户活跃时才会触发整合。传递相同的 thread_id,以便整合智能体可以访问对话上下文。
延迟为对话完成提供了时间(用户可能会发送后续消息),因此整合智能体可以看到完整的交流。
如果用户在延迟期间发送了另一条消息,新运行的 multitask_strategy 控制待处理的整合运行会发生什么。在新运行上使用 rollback 删除过时的整合运行,然后在下次响应后调度一个新的整合运行:
multitask_strategy 如何控制同一线程上并发运行的行为的详细信息,请参阅双重发送。
有关部署具有后台进程的智能体的更多信息,请参阅投入生产。
只读与可写记忆
默认情况下,智能体可以读取和写入记忆文件。对于共享状态,如组织策略或合规规则,你可能希望将记忆设置为只读,以便智能体可以引用但不能修改它。这可以防止通过共享记忆进行提示词注入,并确保只有你的应用程序代码控制文件内容。
安全考虑: 如果一个用户可以写入另一个用户读取的记忆,恶意用户可能会向共享状态注入指令。为了缓解这种情况:
- 默认使用用户作用域
(user_id),除非有特定原因需要共享 - 对共享策略使用只读记忆(通过应用程序代码填充,而不是智能体)
- 在智能体写入敏感路径之前添加人在回路验证。使用中断要求人工批准对敏感路径的写入。
并发写入
多个线程可以并行写入记忆,但对同一文件的并发写入可能导致最后写入胜出的冲突。对于用户作用域记忆,这种情况很少见,因为用户通常一次只有一个活跃对话。对于智能体作用域或组织作用域记忆,可以考虑使用后台整合来序列化写入,或者将记忆结构化为每个主题的单独文件以减少争用。 实际上,如果由于冲突导致写入失败,LLM 通常足够智能,能够重试或优雅地恢复,因此单次丢失的写入并不致命。同一部署中的多个智能体
要在共享部署中为每个智能体提供其专属的记忆,请将assistant_id 添加到命名空间:
(assistant_id,)。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

