针对自托管和欧盟区域部署对于自托管安装或位于欧盟区域的组织,请在以下请求中相应地更新 LangSmith URL。
对于欧盟区域,请使用
eu.api.smith.langchain.com。监控导出状态
要监控导出任务的状态,请使用以下 cURL 命令:{export_id} 替换为您要监控的导出的 ID。此命令将检索指定导出任务的当前状态。
列出导出的运行
一个导出任务通常会被分解为多个运行,每个运行对应一个要导出的特定日期分区。 要列出与特定导出关联的所有运行,请使用以下 cURL 命令:列出所有导出
要检索所有导出任务的列表,请使用以下 cURL 命令:停止导出
要停止现有的导出任务,请使用以下 cURL 命令:{export_id} 替换为您希望取消的导出的 ID。请注意,任务一旦被取消将无法重新启动,您需要创建一个新的导出任务。
故障模式与重试策略
LangSmith 批量导出会自动处理瞬时故障和基础设施问题,以确保弹性。 每个批量导出被划分为多个_运行_,每个运行处理一个特定日期分区(通常按天组织)的数据。运行是独立处理的,这使得:- 可以并行处理不同的时间段。
- 每个运行具有独立的重试逻辑。
- 如果中断,可以从特定的检查点恢复。
FAILED。
自动重试行为
导出任务会自动重试瞬时故障,行为如下:- 最大重试次数:每个运行最多重试 20 次(可能更改)。
- 重试延迟:尝试之间间隔 30 秒(固定,无指数退避)。
- 运行超时:每个运行最长 4 小时。
- 整体工作流超时:整个导出最长 72 小时。
故障场景
任何单个运行失败(在所有重试次数耗尽后)都会导致整个导出失败。
导出状态生命周期
导出可以具有以下状态:| 状态 | 描述 |
|---|---|
CREATED | 导出已创建但尚未开始处理。 |
RUNNING | 导出正在主动处理运行。 |
COMPLETED | 所有运行已成功导出。 |
FAILED | 一个或多个运行在重试耗尽后失败。 |
CANCELLED | 导出被用户手动取消。 |
TIMEDOUT | 导出超过了 48 小时工作流超时限制。 |
CREATED、RUNNING、COMPLETED、FAILED、CANCELLED 或 TIMEDOUT。
并发与速率限制
为确保系统稳定性,导出受以下限制:- 每个导出的最大并发运行数:45
- 每个工作空间的最大并发导出数:15
进度跟踪与可恢复性
导出系统为每个运行维护详细的进度元数据:- 数据流中的最新游标位置。
- 已导出的行数。
- 已写入的 Parquet 文件列表。
- 优雅恢复:如果运行被中断(例如,由于部署),它会从最后一个检查点恢复,而不是从头开始。
- 进度监控:通过 API 跟踪已导出的数据量。
- 高效重试:失败的运行不会重新导出已成功写入的数据。
排查导出失败问题
如果您的导出失败,请按照以下步骤操作:- 检查导出状态:使用
GET /api/v1/bulk-exports/{export_id}端点 检索导出详情和状态。 - 查看运行错误:您可以使用列出运行 API 来监控您的运行。每个运行都包含一个
errors字段,其中包含按重试尝试(例如retry_0、retry_1)索引的详细错误消息。 - 验证目标访问权限:确保您的目标存储桶仍然存在且凭据有效。
- 检查运行大小:如果看到超时错误,您的日期分区可能包含过多数据。建议限制导出的字段。
- 审查系统限制:确保您没有达到并发限制(每个导出 5 个运行,每个工作空间 3 个导出)。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

