
Agent Server 自动处理检查点
当使用 Agent Server 时,你不需要手动实现或配置检查器。服务器在后台为你处理所有持久化基础设施。
为什么使用持久性
以下功能需要持久性:- 人机协作:检查器通过允许人类检查、中断和批准图步骤来促进 人机协作工作流。这些工作流需要检查器,因为人必须能够在任何时间点查看图的状态,并且图必须能够在人对状态进行任何更新后恢复执行。有关示例,请参阅 中断。
- 记忆:检查器允许在交互之间保留 “记忆”。在重复的人类交互(如对话)的情况下,任何后续消息都可以发送到该线程,该线程将保留对之前消息的记忆。有关如何使用检查器添加和管理对话记忆的信息,请参阅 添加记忆。
- 时间旅行:检查器允许 “时间旅行”,允许用户重播之前的图执行以审查和/或调试特定的图步骤。此外,检查器使得在任意检查点分叉图状态以探索替代轨迹成为可能。
- 容错:检查点提供容错和错误恢复:如果某个超级步骤中一个或多个节点失败,你可以从最后一个成功步骤重新启动图。
- 待处理的写入:当图节点在给定 超级步骤 的执行过程中失败时,LangGraph 会存储该超级步骤中任何其他成功完成的节点的待处理检查点写入。当你从该超级步骤恢复图执行时,你不会重新运行成功的节点。
核心概念
线程
线程是检查器保存的每个检查点分配的唯一 ID 或线程标识符。它包含一系列 运行 的累积状态。当运行被执行时,助手底层图的 状态 将被持久化到线程中。 调用带有检查器的图时,你必须在配置的configurable 部分指定 thread_id:
thread_id 作为存储和检索检查点的主键。如果没有它,检查器无法保存状态或在 中断 后恢复执行,因为检查器使用 thread_id 来加载保存的状态。
检查点
线程在特定时间点的状态称为检查点。检查点是每个 超级步骤 保存的图状态快照,由StateSnapshot 对象表示(有关完整字段参考,请参阅 StateSnapshot 字段)。
超级步骤
LangGraph 在每个 超级步骤 边界创建检查点。超级步骤是图的单个“滴答”,其中为该步骤调度的所有节点执行(可能并行)。对于像START -> A -> B -> END 这样的顺序图,输入、节点 A 和节点 B 有单独的超级步骤——每个之后生成一个检查点。理解超级步骤边界对于 时间旅行 很重要,因为你只能从检查点(即超级步骤边界)恢复执行。
检查点被持久化并可用于稍后恢复线程的状态。
让我们看看当简单图按如下方式调用时会保存哪些检查点:
- 空检查点,下一个要执行的节点为 [
START] - 检查点包含用户输入
{'foo': '', 'bar': []}和下一个要执行的节点nodeA - 检查点包含
nodeA的输出{'foo': 'a', 'bar': ['a']}和下一个要执行的节点nodeB - 检查点包含
nodeB的输出{'foo': 'b', 'bar': ['a', 'b']}且没有下一个要执行的节点
bar 通道值包含来自两个节点的输出,因为我们为 bar 通道有一个归约器。
检查点命名空间
每个检查点都有一个checkpoint_ns(检查点命名空间)字段,用于标识它属于哪个图或子图:
""(空字符串):检查点属于父(根)图。"node_name:uuid":检查点属于作为给定节点调用的子图。对于嵌套子图,命名空间用|分隔符连接(例如,"outer_node:uuid|inner_node:uuid")。
获取和更新状态
获取状态
在与保存的图状态交互时,你必须指定 线程标识符。你可以通过调用graph.getState(config) 查看图的 最新 状态。这将返回一个 StateSnapshot 对象,对应于配置中提供的线程 ID 关联的最新检查点,或者如果提供,则对应于线程的检查点 ID 关联的检查点。
getState 的输出看起来像这样:
StateSnapshot 字段
| 字段 | 类型 | 描述 |
|---|---|---|
values | object | 此检查点的状态通道值。 |
next | string[] | 下一个要执行的节点名称。空 [] 表示图已完成。 |
config | object | 包含 thread_id、checkpoint_ns 和 checkpoint_id。 |
metadata | object | 执行元数据。包含 source("input"、"loop" 或 "update")、writes(节点输出)和 step(超级步骤计数器)。 |
createdAt | string | 创建此检查点的 ISO 8601 时间戳。 |
parentConfig | object | null | 前一个检查点的配置。第一个检查点为 null。 |
tasks | PregelTask[] | 此步骤要执行的任务。每个任务都有 id、name、error、interrupts,以及可选的 state(子图快照,当使用 subgraphs: true 时)。 |
获取状态历史
你可以通过调用graph.getStateHistory(config) 获取给定线程的图执行完整历史记录。这将返回与配置中提供的线程 ID 关联的 StateSnapshot 对象列表。重要的是,检查点将按时间顺序排列,最新的检查点 / StateSnapshot 位于列表中的第一位。
getStateHistory 的输出看起来像这样:

查找特定检查点
你可以过滤状态历史以查找符合特定标准的检查点:重放
重放从先前的检查点重新执行步骤。使用先前的checkpoint_id 调用图以重新运行该检查点之后的节点。检查点之前的节点会被跳过(它们的结果已保存)。检查点之后的节点会重新执行,包括任何 LLM 调用、API 请求或 中断 —— 在重放期间总是会被重新触发。
有关重放过去执行的完整详细信息和代码示例,请参阅 时间旅行。

更新状态
你可以使用graph.updateState() 编辑图状态。这会创建一个具有更新值的新检查点 —— 它不会修改原始检查点。更新被视为与节点更新相同:当定义时,值会通过 归约 函数传递,因此具有归约器的通道会 累积 值而不是覆盖它们。
你可以选择指定 asNode 来控制更新被视为来自哪个节点,这会影响下一个执行哪个节点。有关详细信息,请参阅 时间旅行:asNode。

内存存储

Store 接口的需求。作为一个说明,我们可以定义一个 InMemoryStore 来跨线程存储有关用户的信息。我们只需像以前一样用检查器编译我们的图,并传递存储。
LangGraph API 自动处理存储
当使用 LangGraph API 时,你不需要手动实现或配置存储。API 在后台为你处理所有存储基础设施。
InMemoryStore 适用于开发和测试。对于生产环境,请使用持久化存储,如
PostgresStore 或 RedisStore。所有实现都扩展了 BaseStore,这是节点函数签名中使用的类型注解。基本用法
首先,让我们在不使用 LangGraph 的情况下孤立地展示这一点。tuple 进行命名空间划分,在这个特定示例中将是 (<user_id>, "memories")。命名空间可以是任何长度并代表任何内容,不必是用户特定的。
store.put 方法将记忆保存到存储中的命名空间。当我们这样做时,我们指定如上定义的命名空间,以及记忆的键值对:键只是记忆的唯一标识符(memory_id),值(字典)是记忆本身。
store.search 方法读取命名空间中的记忆,该方法将返回给定用户的所有记忆作为列表。最新的记忆在列表的最后。
-
value: 该记忆的值 -
key: 此命名空间中此记忆的唯一键 -
namespace: 字符串元组,此记忆类型的命名空间虽然类型是tuple,但在转换为 JSON 时可能会序列化为列表(例如,['1', 'memories'])。 -
createdAt: 创建此记忆的时间戳 -
updatedAt: 更新此记忆的时间戳
语义搜索
除了简单的检索外,存储还支持语义搜索,允许你基于含义而不是精确匹配来查找记忆。为此,请配置存储以使用嵌入模型:fields 参数或在存储记忆时指定 index 参数来控制你的记忆的哪些部分被嵌入:
在 LangGraph 中使用
有了所有这些,我们在 LangGraph 中使用memoryStore。memoryStore 与检查器协同工作:检查器将状态保存到线程,如上所述,而 memoryStore 允许我们存储任意信息以供 跨 线程访问。我们使用检查器和 memoryStore 一起编译图,如下所示。
thread_id 调用图,同时也使用 user_id,我们将用它来将我们的记忆命名空间到此特定用户,就像上面展示的那样。
runtime 参数访问存储和 userId。以下是你可能如何使用它来保存记忆:
store.search 方法获取记忆。回想一下,记忆作为可转换为字典的对象列表返回。
user_id 相同,我们仍然可以访问相同的记忆。
langgraph.json 文件中配置索引设置。例如:
检查器库
在底层,检查点由符合BaseCheckpointSaver 接口的检查器对象提供支持。LangGraph 提供了几种检查器实现,均通过独立的、可安装的库实现。
@langchain/langgraph-checkpoint: 检查器保存器的基础接口 (BaseCheckpointSaver) 和序列化/反序列化接口 (SerializerProtocol)。包括用于实验的内存检查器实现 (MemorySaver)。LangGraph 随附@langchain/langgraph-checkpoint。@langchain/langgraph-checkpoint-sqlite: 使用 SQLite 数据库 (SqliteSaver) 的 LangGraph 检查器实现。适用于实验和本地工作流。需要单独安装。@langchain/langgraph-checkpoint-postgres: 使用 Postgres 数据库 (PostgresSaver) 的高级检查器,在 LangSmith 中使用。适用于在生产环境中使用。需要单独安装。@langchain/langgraph-checkpoint-mongodb: 使用 MongoDB 数据库 (MongoDBSaver) 的高级检查器。适用于在生产环境中使用。需要单独安装。@langchain/langgraph-checkpoint-redis: 使用 Redis 数据库 (RedisSaver) 的高级检查器。适用于在生产环境中使用。需要单独安装。
检查器接口
每个检查器都符合BaseCheckpointSaver 接口并实现以下方法:
.put- 存储其配置和元数据的检查点。.putWrites- 存储链接到检查点的中间写入(即 待处理写入)。.getTuple- 使用给定配置(thread_id和checkpoint_id)获取检查点元组。这用于在graph.getState()中填充StateSnapshot。.list- 列出符合给定配置和筛选条件的检查点。这用于在graph.getStateHistory()中填充状态历史。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

