ls、read_file、write_file、edit_file、glob 和 grep 等工具向智能体暴露一个文件系统接口。这些工具通过可插拔的后端进行操作。read_file 工具在所有后端中均原生支持图像文件(.png、.jpg、.jpeg、.gif、.webp),并将其作为多模态内容块返回。
沙盒和 LocalShellBackend 还提供了一个 execute 工具。
本页解释了如何选择后端、将不同路径路由到不同后端、实现您自己的虚拟文件系统(例如 S3 或 Postgres)、添加策略钩子以及遵守 BackendProtocol。
快速开始
以下是几个预构建的文件系统后端,您可以快速与您的深度智能体一起使用:| 内置后端 | 描述 |
|---|---|
| 默认 | agent = create_deep_agent() 状态中的临时存储。智能体的默认文件系统后端存储在 langgraph 状态中。请注意,此文件系统仅在单个线程内持久化。 |
| 本地文件系统持久化 | agent = create_deep_agent(backend=FilesystemBackend(root_dir="/Users/nh/Desktop/")) 这使深度智能体能够访问您本地机器的文件系统。您可以指定智能体有权访问的根目录。请注意,任何提供的 root_dir 必须是绝对路径。 |
| 持久化存储(LangGraph 存储) | agent = create_deep_agent(backend=lambda rt: StoreBackend(rt)) 这使智能体能够访问跨线程持久化的长期存储。这对于存储长期记忆或适用于智能体多次执行的指令非常有用。 |
| 沙盒 | agent = create_deep_agent(backend=sandbox) 在隔离环境中执行代码。沙盒提供文件系统工具以及用于运行 shell 命令的 execute 工具。可选择 Modal、Daytona、Deno 或本地 VFS。 |
| 本地 Shell | agent = create_deep_agent(backend=LocalShellBackend(root_dir=".", env={"PATH": "/usr/bin:/bin"})) 直接在主机上进行文件系统和 shell 执行。无隔离——仅在受控的开发环境中使用。请参阅下面的安全注意事项。 |
| 复合 | 默认临时存储,/memories/ 持久化。复合后端具有最大的灵活性。您可以指定文件系统中的不同路由指向不同的后端。请参阅下面的复合路由示例,这是一个可直接粘贴的示例。 |
内置后端
StateBackend(临时存储)
- 通过
StateBackend将文件存储在 LangGraph 智能体状态中,用于当前线程。 - 通过检查点在同一个线程的多次智能体轮次中持久化。
- 作为智能体编写中间结果的暂存区。
- 自动驱逐大型工具输出,智能体可以随后分片读回。
FilesystemBackend(本地磁盘)
FilesystemBackend 在可配置的根目录下读取和写入真实文件。
- 在可配置的
root_dir下读取/写入真实文件。 - 您可以选择设置
virtual_mode=True以在root_dir下进行沙盒化和路径规范化。 - 使用安全的路径解析,尽可能防止不安全的符号链接遍历,可以使用 ripgrep 进行快速的
grep。
- 您机器上的本地项目
- CI 沙盒
- 挂载的持久化卷
LocalShellBackend(本地 Shell)
- 扩展了
FilesystemBackend,增加了用于在主机上运行 shell 命令的execute工具。 - 命令使用
subprocess.run(shell=True)直接在您的机器上运行,无沙盒化。 - 支持
timeout(默认 120 秒)、max_output_bytes(默认 100,000)、env和inherit_env用于环境变量。 - Shell 命令使用
root_dir作为工作目录,但可以访问系统上的任何路径。
- 本地编码助手和开发工具
- 在您信任智能体时进行快速开发迭代
StoreBackend(LangGraph 存储)
When deploying to LangSmith Deployment, omit the
store parameter. The platform automatically provisions a store for your agent.StoreBackend将文件存储在运行时提供的 LangGraphBaseStore中,实现跨线程的持久化存储。
- 当您已经运行配置了 LangGraph 存储时(例如,Redis、Postgres 或
BaseStore背后的云实现)。 - 当您通过 LangSmith 部署 部署您的智能体时(会自动为您的智能体配置存储)。
命名空间工厂
命名空间工厂控制StoreBackend 读取和写入数据的位置。它接收一个 BackendContext 并返回一个用作存储命名空间的字符串元组。使用命名空间工厂来隔离用户、租户或助手之间的数据。
BackendContext 提供:
ctx.runtime.context— 通过 LangGraph 的上下文模式传递的用户提供的上下文(例如,user_id)ctx.state— 当前智能体状态
assistant_id 和 thread_id,请在工厂内部使用 langgraph.config.get_config() — 这些在 LangGraph 配置元数据中可用,但不在上下文模式中。
常见的命名空间模式:
(user_id, thread_id) 用于按用户按对话隔离,或者附加后缀如 "filesystem" 以在相同范围使用多个存储命名空间时进行区分。
命名空间组件只能包含字母数字字符、连字符、下划线、点、@、+、冒号和波浪号。通配符(*、?)会被拒绝以防止 glob 注入。
CompositeBackend(路由器)
CompositeBackend根据路径前缀将文件操作路由到不同的后端。- 在列表和搜索结果中保留原始路径前缀。
- 当您希望为智能体同时提供临时和跨线程存储时,
CompositeBackend允许您同时提供StateBackend和StoreBackend - 当您有多个信息源希望作为单个文件系统的一部分提供给智能体时。
- 例如,您在一个 Store 的
/memories/下存储了长期记忆,并且还有一个自定义后端,在/docs/下可访问文档。
- 例如,您在一个 Store 的
指定后端
- 将后端传递给
create_deep_agent(backend=...)。文件系统中间件将其用于所有工具。 - 您可以传递:
- 一个实现
BackendProtocol的实例(例如,FilesystemBackend(root_dir=".")),或者 - 一个工厂函数
BackendFactory = Callable[[ToolRuntime], BackendProtocol](适用于需要运行时的后端,如StateBackend或StoreBackend)。
- 一个实现
- 如果省略,默认为
lambda rt: StateBackend(rt)。
路由到不同后端
将命名空间的部分路由到不同的后端。通常用于持久化/memories/* 并保持其他所有内容为临时存储。
/workspace/plan.md→StateBackend(临时存储)/memories/agent.md→FilesystemBackend下的/deepagents/myagentls、glob、grep聚合结果并显示原始路径前缀。
- 更长的前缀优先(例如,路由
"/memories/projects/"可以覆盖"/memories/")。 - 对于 StoreBackend 路由,请确保智能体运行时提供了存储(
runtime.store)。
使用虚拟文件系统
构建自定义后端,将远程或数据库文件系统(例如 S3 或 Postgres)投影到工具命名空间中。 设计指南:- 路径是绝对的(
/x/y.txt)。决定如何将它们映射到您的存储键/行。 - 高效实现
ls_info和glob_info(在可用时使用服务器端列表,否则使用本地过滤器)。 - 对于缺失文件或无效正则表达式模式,返回用户可读的错误字符串。
- 对于外部持久化,在结果中设置
files_update=None;只有状态后端应返回files_update字典。
- 表
files(path text primary key, content text, created_at timestamptz, modified_at timestamptz) - 将工具操作映射到 SQL:
ls_info使用WHERE path LIKE $1 || '%'glob_info在 SQL 中过滤或获取后在 Python 中应用 globgrep_raw可以通过扩展名或最后修改时间获取候选行,然后扫描行
添加策略钩子
通过子类化或包装后端来强制执行企业规则。 阻止在选定前缀下写入/编辑(子类化): 通用包装器(适用于任何后端):协议参考
后端必须实现BackendProtocol。
必需的端点:
ls_info(path: str) -> list[FileInfo]- 返回至少包含
path的条目。在可用时包含is_dir、size、modified_at。按path排序以获得确定性输出。
- 返回至少包含
read(file_path: str, offset: int = 0, limit: int = 2000) -> str- 返回带行号的内容。文件缺失时,返回
"Error: File '/x' not found"。
- 返回带行号的内容。文件缺失时,返回
grep_raw(pattern: str, path: Optional[str] = None, glob: Optional[str] = None) -> list[GrepMatch] | str- 返回结构化匹配项。对于无效的正则表达式,返回类似
"Invalid regex pattern: ..."的字符串(不要引发异常)。
- 返回结构化匹配项。对于无效的正则表达式,返回类似
glob_info(pattern: str, path: str = "/") -> list[FileInfo]- 返回匹配的文件作为
FileInfo条目(如果没有则返回空列表)。
- 返回匹配的文件作为
write(file_path: str, content: str) -> WriteResult- 仅创建。冲突时,返回
WriteResult(error=...)。成功时,设置path,对于状态后端设置files_update={...};外部后端应使用files_update=None。
- 仅创建。冲突时,返回
edit(file_path: str, old_string: str, new_string: str, replace_all: bool = False) -> EditResult- 除非
replace_all=True,否则强制执行old_string的唯一性。如果未找到,返回错误。成功时包含occurrences。
- 除非
WriteResult(error, path, files_update)EditResult(error, path, files_update, occurrences)FileInfo包含字段:path(必需),可选地is_dir、size、modified_at。GrepMatch包含字段:path、line、text。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

