在子代理架构中,一个中央主代理(通常称为监督者)通过将子代理作为工具调用来协调它们。主代理决定调用哪个子代理、提供什么输入以及如何组合结果。子代理是无状态的——它们不记得过去的交互,所有对话记忆都由主代理维护。这提供了上下文隔离:每个子代理调用都在一个干净的上下文窗口中工作,防止主对话中的上下文膨胀。
关键特性
- 集中控制:所有路由都经过主代理
- 无直接用户交互:子代理将结果返回给主代理,而不是用户(不过你可以在子代理内使用中断来允许用户交互)
- 通过工具调用子代理:子代理通过工具调用
- 并行执行:主代理可以在单次轮次中调用多个子代理
监督者 vs. 路由器:监督者代理(此模式)不同于路由器。监督者是一个完整的代理,它维护对话上下文并动态决定在多个轮次中调用哪些子代理。路由器通常是一个单一的分类步骤,它将任务分派给代理,而不维护持续的对话状态。
何时使用
当你有多个不同的领域(例如,日历、电子邮件、CRM、数据库)、子代理不需要直接与用户对话,或者你想要集中式工作流控制时,使用子代理模式。对于只有少数工具的简单情况,使用单一代理。
需要在子代理内进行用户交互? 虽然子代理通常将结果返回给主代理,而不是直接与用户对话,但你可以在子代理内使用中断来暂停执行并收集用户输入。当子代理在继续之前需要澄清或批准时,这很有用。主代理仍然是协调者,但子代理可以在任务中途从用户那里收集信息。
基本实现
核心机制是将子代理包装为主代理可以调用的工具:
import { createAgent, tool } from "langchain";
import { z } from "zod";
// 创建一个子代理
const subagent = createAgent({ model: "anthropic:claude-sonnet-4-20250514", tools: [...] });
// 将其包装为工具
const callResearchAgent = tool(
async ({ query }) => {
const result = await subagent.invoke({
messages: [{ role: "user", content: query }]
});
return result.messages.at(-1)?.content;
},
{
name: "research",
description: "研究一个主题并返回发现结果",
schema: z.object({ query: z.string() })
}
);
// 主代理,将子代理作为工具
const mainAgent = createAgent({ model: "anthropic:claude-sonnet-4-20250514", tools: [callResearchAgent] });
教程:使用子代理构建个人助手
学习如何使用子代理模式构建个人助手,其中一个中央主代理(监督者)协调专门的子代理。
设计决策
在实现子代理模式时,你将做出几个关键的设计选择。此表总结了选项——每个选项在下面的章节中都有详细说明。
| 决策 | 选项 |
|---|
| 同步 vs. 异步 | 同步(阻塞) vs. 异步(后台) |
| 工具模式 | 每个代理一个工具 vs. 单一调度工具 |
| 子代理规范 | 系统提示 vs. 枚举约束 vs. 基于工具的发现(仅限单一调度工具) |
| 子代理输入 | 仅查询 vs. 完整上下文 |
| 子代理输出 | 子代理结果 vs. 完整对话历史 |
同步 vs. 异步
子代理执行可以是同步的(阻塞)或异步的(后台)。你的选择取决于主代理是否需要结果才能继续。
| 模式 | 主代理行为 | 最适合 | 权衡 |
|---|
| 同步 | 等待子代理完成 | 主代理需要结果才能继续 | 简单,但会阻塞对话 |
| 异步 | 在子代理后台运行时继续 | 独立任务,用户不应等待 | 响应迅速,但更复杂 |
不要与 Python 的 async/await 混淆。这里的“异步”意味着主代理启动一个后台作业(通常在单独的进程或服务中)并在不阻塞的情况下继续。
同步(默认)
默认情况下,子代理调用是同步的:主代理等待每个子代理完成后再继续。当主代理的下一个操作依赖于子代理的结果时,使用同步。
何时使用同步:
- 主代理需要子代理的结果来构建其响应
- 任务具有顺序依赖性(例如,获取数据 → 分析 → 响应)
- 子代理失败应阻止主代理的响应
权衡:
- 实现简单——只需调用并等待
- 在所有子代理完成之前,用户看不到响应
- 长时间运行的任务会冻结对话
当子代理的工作是独立的——主代理不需要结果来继续与用户对话时,使用异步执行。主代理启动一个后台作业并保持响应。
何时使用异步:
- 子代理工作独立于主对话流
- 用户应该能够在工作进行时继续聊天
- 你想并行运行多个独立任务
三工具模式:
- 启动作业:启动后台任务,返回作业 ID
- 检查状态:返回当前状态(待处理、运行中、已完成、失败)
- 获取结果:检索已完成的结果
处理作业完成: 当作业完成时,你的应用程序需要通知用户。一种方法是:显示一个通知,点击后发送一个 HumanMessage,例如“检查 job_123 并总结结果”。
工具模式
有两种主要方式将子代理暴露为工具:
| 模式 | 最适合 | 权衡 |
|---|
| 每个代理一个工具 | 对每个子代理的输入/输出进行细粒度控制 | 设置更多,但定制性更强 |
| 单一调度工具 | 许多代理,分布式团队,约定优于配置 | 组合更简单,每个代理的定制性较低 |
每个代理一个工具
关键思想是将子代理包装为主代理可以调用的工具:
import { createAgent, tool } from "langchain";
import * as z from "zod";
// 创建一个子代理
const subagent = createAgent({...});
// 将其包装为工具
const callSubagent = tool(
async ({ query }) => {
const result = await subagent.invoke({
messages: [{ role: "user", content: query }]
});
return result.messages.at(-1)?.text;
},
{
name: "subagent_name",
description: "subagent_description",
schema: z.object({
query: z.string().describe("发送给子代理的查询")
})
}
);
// 主代理,将子代理作为工具
const mainAgent = createAgent({ model, tools: [callSubagent] });
当主代理决定任务匹配子代理的描述时,它会调用子代理工具,接收结果,并继续协调。有关细粒度控制,请参阅上下文工程。
单一调度工具
另一种方法是使用一个参数化的工具来调用临时子代理以处理独立任务。与每个代理一个工具方法(每个子代理被包装为单独的工具)不同,这种方法使用基于约定的方法,只有一个 task 工具:任务描述作为人类消息传递给子代理,子代理的最终消息作为工具结果返回。
当你希望跨多个团队分发代理开发、需要将复杂任务隔离到单独的上下文窗口中、需要一种可扩展的方式来添加新代理而无需修改协调器,或者偏好约定优于定制时,使用此方法。这种方法以牺牲上下文工程的灵活性为代价,换来了代理组合的简单性和强大的上下文隔离。
关键特性:
- 单一任务工具:一个参数化的工具,可以通过名称调用任何已注册的子代理
- 基于约定的调用:通过名称选择代理,任务作为人类消息传递,最终消息作为工具结果返回
- 团队分布:不同的团队可以独立开发和部署代理
- 代理发现:子代理可以通过系统提示(列出可用代理)或通过渐进式披露(通过工具按需加载代理信息)来发现
这种方法的一个有趣之处在于,子代理可能拥有与主代理完全相同的功能。在这种情况下,调用子代理主要是出于上下文隔离的原因——允许复杂、多步骤的任务在隔离的上下文窗口中运行,而不会使主代理的对话历史膨胀。子代理自主完成其工作,并仅返回简洁的摘要,保持主线程专注且高效。
import { tool, createAgent } from "langchain";
import * as z from "zod";
// 由不同团队开发的子代理
const researchAgent = createAgent({
model: "gpt-4.1",
prompt: "你是一名研究专家...",
});
const writerAgent = createAgent({
model: "gpt-4.1",
prompt: "你是一名写作专家...",
});
// 可用子代理的注册表
const SUBAGENTS = {
research: researchAgent,
writer: writerAgent,
};
const task = tool(
async ({ agentName, description }) => {
const agent = SUBAGENTS[agentName];
const result = await agent.invoke({
messages: [
{ role: "user", content: description }
],
});
return result.messages.at(-1)?.content;
},
{
name: "task",
description: `启动一个临时子代理。
可用代理:
- research: 研究和事实查找
- writer: 内容创作和编辑`,
schema: z.object({
agentName: z
.string()
.describe("要调用的代理名称"),
description: z
.string()
.describe("任务描述"),
}),
}
);
// 主协调器代理
const mainAgent = createAgent({
model: "gpt-4.1",
tools: [task],
prompt: (
"你协调专门的子代理。 " +
"可用代理:research(事实查找)," +
"writer(内容创作)。 " +
"使用 task 工具来委派工作。"
),
});
上下文工程
控制上下文如何在主代理及其子代理之间流动:
| 类别 | 目的 | 影响 |
|---|
| 子代理规范 | 确保子代理在应该被调用时被调用 | 主代理的路由决策 |
| 子代理输入 | 确保子代理能够在优化的上下文中良好执行 | 子代理性能 |
| 子代理输出 | 确保监督者能够根据子代理结果采取行动 | 主代理性能 |
另请参阅我们关于代理上下文工程的全面指南。
子代理规范
与子代理关联的名称和描述是主代理知道调用哪些子代理的主要方式。这些是提示杠杆——请谨慎选择。
- 名称:主代理如何引用子代理。保持清晰且面向行动(例如,
research_agent、code_reviewer)。
- 描述:主代理了解的子代理功能。具体说明它处理哪些任务以及何时使用它。
对于单一调度工具设计,你必须额外向主代理提供有关它可以调用的子代理的信息。
你可以根据代理数量以及注册表是静态还是动态,以不同方式提供此信息:
| 方法 | 最适合 | 权衡 |
|---|
| 系统提示枚举 | 小型、静态代理列表(< 10 个代理) | 简单,但代理更改时需要更新提示 |
| 枚举约束 | 小型、静态代理列表(< 10 个代理) | 类型安全且明确,但代理更改时需要修改代码 |
| 基于工具的发现 | 大型或动态代理注册表 | 灵活且可扩展,但增加了复杂性 |
系统提示枚举
直接在主代理的系统提示中列出可用代理。主代理将代理列表及其描述作为其指令的一部分。
何时使用:
- 你有一个小型、固定的代理集(< 10 个)
- 代理注册表很少更改
- 你想要最简单的实现
示例:
main_agent = create_agent(
model="...",
tools=[task],
system_prompt=(
"你协调专门的子代理。 "
"可用代理:\n"
"- research: 研究和事实查找\n"
"- writer: 内容创作和编辑\n"
"- reviewer: 代码和文档审阅\n"
"使用 task 工具来委派工作。"
),
)
调度工具上的枚举约束
在你的调度工具的 agent_name 参数上添加枚举约束。这提供了类型安全性,并使可用代理在工具模式中明确。
何时使用:
- 你有一个小型、固定的代理集(< 10 个)
- 你想要类型安全性和明确的代理名称
- 你偏好基于模式的验证,而不是基于提示的指导
示例:
from enum import Enum
class AgentName(str, Enum):
RESEARCH = "research"
WRITER = "writer"
REVIEWER = "reviewer"
@tool
def task(
agent_name: AgentName, # 枚举约束
description: str
) -> str:
"""启动一个临时子代理来处理任务。"""
# ...
基于工具的发现
提供一个单独的工具(例如,list_agents 或 search_agents),主代理可以调用它来按需发现可用代理。这支持渐进式披露并支持动态注册表。
何时使用:
- 你有很多代理(> 10 个)或不断增长的注册表
- 代理注册表频繁更改或是动态的
- 你想要减少提示大小和令牌使用量
- 不同的团队独立管理不同的代理
示例:
@tool
def list_agents(query: str = "") -> str:
"""列出可用子代理,可选地按查询过滤。"""
agents = search_agent_registry(query)
return format_agent_list(agents)
@tool
def task(agent_name: str, description: str) -> str:
"""启动一个临时子代理来处理任务。"""
# ...
main_agent = create_agent(
model="...",
tools=[task, list_agents],
system_prompt="使用 list_agents 来发现可用子代理,然后使用 task 来调用它们。"
)
子代理输入
自定义子代理接收的上下文以执行其任务。通过从代理状态中提取,添加上下文,这些上下文不切实际地捕获在静态提示中——完整的消息历史、先前的结果或任务元数据。
import { createAgent, tool, AgentState, ToolMessage } from "langchain";
import { Command } from "@langchain/langgraph";
import * as z from "zod";
// 通过状态将完整对话历史传递给子代理的示例。
const callSubagent1 = tool(
async ({query}) => {
const state = getCurrentTaskInput<AgentState>();
// 应用任何所需的逻辑,将消息转换为合适的输入
const subAgentInput = someLogic(query, state.messages);
const result = await subagent1.invoke({
messages: subAgentInput,
// 你也可以根据需要在此处传递其他状态键。
// 确保在主代理和子代理的状态模式中都定义了这些键。
exampleStateKey: state.exampleStateKey
});
return result.messages.at(-1)?.content;
},
{
name: "subagent1_name",
description: "subagent1_description",
}
);
子代理输出
自定义主代理接收到的内容,以便它能做出良好的决策。两种策略:
- 提示子代理:明确指定应返回的内容。一个常见的失败模式是子代理执行工具调用或推理,但未在其最终消息中包含结果——提醒它监督者只看到最终输出。
- 在代码中格式化:在返回之前调整或丰富响应。例如,使用
Command 将特定的状态键与最终文本一起传回。
import { tool, ToolMessage } from "langchain";
import { Command } from "@langchain/langgraph";
import * as z from "zod";
const callSubagent1 = tool(
async ({ query }, config) => {
const result = await subagent1.invoke({
messages: [{ role: "user", content: query }]
});
// 返回一个 Command 来更新多个状态键
return new Command({
update: {
// 从子代理传回额外的状态
exampleStateKey: result.exampleStateKey,
messages: [
new ToolMessage({
content: result.messages.at(-1)?.text,
tool_call_id: config.toolCall?.id!
})
]
}
});
},
{
name: "subagent1_name",
description: "subagent1_description",
schema: z.object({
query: z.string().describe("发送给子代理1的查询")
})
}
);
检查点和状态检查
默认情况下,子代理使用继承的检查点模式——每次调用都从新状态开始,支持中断,并且可以安全地并行运行。如果你需要一个子代理在多次调用之间维护其自己的持久对话历史,请使用 checkpointer=True(延续模式)编译它。有关模式的完整比较,请参阅子图持久性。
由于子代理是在工具函数内部调用的,LangGraph 无法静态发现它们。这意味着带有 subgraphs 的 get_state 将不会返回子代理状态。如果你需要读取嵌套图状态(例如,在中断期间),请改为在自定义图中从节点函数调用子代理。有关每种模式如何影响状态可见性的详细信息,请参阅子图持久性。