@langchain/openai 包提供了与 LangChain 兼容的 OpenAI 内置工具封装器。这些工具可以使用 bindTools() 或 createAgent 绑定到 ChatOpenAI。
网络搜索工具
网络搜索工具允许 OpenAI 模型在生成响应前搜索网络以获取最新信息。网络搜索支持三种主要类型:- 非推理网络搜索:快速查找,模型将查询直接传递给搜索工具
- 带推理模型的代理搜索:模型主动管理搜索过程,分析结果并决定是否继续搜索
- 深度研究:使用
o3-deep-research或gpt-5等高推理能力模型进行的扩展调查
MCP 工具(模型上下文协议)
MCP 工具允许 OpenAI 模型连接到远程 MCP 服务器和 OpenAI 维护的服务连接器,使模型能够访问外部工具和服务。 有两种使用 MCP 工具的方式:- 远程 MCP 服务器:通过 URL 连接到任何公共 MCP 服务器
- 连接器:使用 OpenAI 维护的流行服务封装器,如 Google Workspace 或 Dropbox
代码解释器工具
代码解释器工具允许模型在沙盒环境中编写和运行 Python 代码以解决复杂问题。 使用代码解释器进行:- 数据分析:处理具有多样化数据和格式的文件
- 文件生成:创建包含数据和图表图像的文件
- 迭代编码:迭代编写和运行代码以解决问题
- 视觉智能:裁剪、缩放、旋转和变换图像
注意:容器在 20 分钟不活动后过期。虽然称为“代码解释器”,但模型知道它是“python 工具”——为了明确提示,请在提示中要求使用“python 工具”。更多信息,请参阅 OpenAI 的代码解释器文档。
文件搜索工具
文件搜索工具允许模型使用语义和关键词搜索从您的文件中查找相关信息。它支持从存储在向量存储中的先前上传文件的知识库中检索。 先决条件:使用文件搜索前,您必须:- 将文件上传到 File API,设置
purpose: "assistants" - 创建向量存储
- 将文件添加到向量存储
eq(等于)、ne(不等于)、gt(大于)、gte(大于或等于)、lt(小于)、lte(小于或等于)。
更多信息,请参阅 OpenAI 的文件搜索文档。
图像生成工具
图像生成工具允许模型使用文本提示和可选的图像输入来生成或编辑图像。它利用 GPT 图像模型,并自动优化文本输入以提高性能。 使用图像生成进行:- 从文本创建图像:根据详细的文本描述生成图像
- 编辑现有图像:根据文本指令修改图像
- 多轮图像编辑:在对话轮次中迭代优化图像
- 多种输出格式:支持 PNG、JPEG 和 WebP 格式
提示技巧:使用“绘制”或“编辑”等术语以获得最佳效果。对于组合图像,请说“通过添加这个元素来编辑第一张图像”,而不是“组合”或“合并”。支持的模型:
gpt-4o、gpt-4o-mini、gpt-4.1、gpt-4.1-mini、gpt-4.1-nano、o3
更多信息,请参阅 OpenAI 的图像生成文档。
计算机使用工具
计算机使用工具允许模型通过模拟鼠标点击、键盘输入、滚动等来控制计算机界面。它使用 OpenAI 的计算机使用代理(CUA)模型来理解屏幕截图并建议操作。测试版:计算机使用功能处于测试阶段。仅在沙盒环境中使用,不要用于高风险或需要身份验证的任务。对于重要决策,始终实施人在回路机制。工作原理:该工具在连续循环中运行:
- 模型发送计算机操作(点击、输入、滚动等)
- 您的代码在受控环境中执行这些操作
- 您捕获结果的屏幕截图
- 将屏幕截图发送回模型
- 重复直到任务完成
本地 Shell 工具
本地 Shell 工具允许模型在您提供的机器上本地运行 shell 命令。命令在您自己的运行时内执行——API 仅返回指令。
安全警告:运行任意 shell 命令可能很危险。在将命令转发到系统 shell 之前,始终进行沙盒执行或添加严格的允许/拒绝列表。
注意:此工具设计用于 Codex CLI 和 codex-mini-latest 模型。
command- 要执行的 argv 令牌数组env- 要设置的环境变量working_directory- 运行命令的目录timeout_ms- 建议的超时时间(请强制执行您自己的限制)user- 运行命令的可选用户
Shell 工具
Shell 工具允许模型通过您的集成运行 shell 命令。与本地 Shell 不同,此工具支持并发执行多个命令,并且设计用于gpt-5.1。
安全警告:运行任意 shell 命令可能很危险。在将命令转发到系统 shell 之前,始终进行沙盒执行或添加严格的允许/拒绝列表。使用场景:
- 自动化文件系统或进程诊断 – 例如,“查找 ~/Documents 下最大的 PDF 文件”
- 扩展模型能力 – 使用内置的 UNIX 实用程序、Python 运行时和其他 CLI
- 运行多步骤构建和测试流程 – 链接命令,如
pip install和pytest - 复杂的代理编码工作流 – 与
apply_patch结合使用以进行文件操作
commands- 要执行的 shell 命令数组(可以并发运行)timeout_ms- 可选的超时时间(毫秒)(请强制执行您自己的限制)max_output_length- 每个命令返回的最大字符数(可选)
ShellResult:
注意:仅通过 Responses API 与更多信息,请参阅 OpenAI 的 Shell 文档。gpt-5.1一起可用。模型提供的timeout_ms仅是一个提示——始终强制执行您自己的限制。
应用补丁工具
应用补丁工具允许模型提出结构化的差异,由您的集成来应用。这使得模型能够在您的代码库中创建、更新和删除文件,从而实现迭代的、多步骤的代码编辑工作流。 何时使用:- 多文件重构 – 重命名符号、提取辅助函数或重新组织模块
- 错误修复 – 让模型既诊断问题又发出精确的补丁
- 测试和文档生成 – 创建新的测试文件、夹具和文档
- 迁移和机械编辑 – 应用重复的、结构化的更新
安全警告:应用补丁可能会修改您的代码库中的文件。始终验证路径、实施备份,并考虑沙盒化。
注意:此工具设计用于 gpt-5.1 模型。
create_file– 在path处创建新文件,内容来自diffupdate_file– 使用diff中的 V4A 差异格式修改path处的现有文件delete_file– 删除path处的文件
- 路径验证:防止目录遍历,并将编辑限制在允许的目录中
- 备份:考虑在应用补丁前备份文件
- 错误处理:返回描述性的错误消息,以便模型可以恢复
- 原子性:决定是否要“全有或全无”的语义(如果任何补丁失败则回滚)
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

