本页描述了如何在 Kubernetes 集群中设置 LangSmith(可观测性、追踪和评估)。您将使用 Helm 来安装 LangSmith 及其依赖项。
完成本页操作后,您将拥有:
- LangSmith UI 和 API:用于可观测性、追踪和评估。
- 后端服务:(队列、Playground、ACE)。
- 数据存储:(PostgreSQL、Redis、ClickHouse,可选的对象存储)。
- Google Kubernetes Engine (GKE)
- Amazon Elastic Kubernetes Service (EKS):有关架构模式与最佳实践,请参阅在 AWS 上自托管。
- Azure Kubernetes Service (AKS):有关架构模式与最佳实践,请参阅在 AKS 上自托管。
- OpenShift (4.14+)
- Minikube 和 Kind(用于开发目的)
LangChain 提供了 Terraform 模块来帮助为 LangSmith 配置基础设施。这些模块可以快速为您的部署设置 Kubernetes 集群、存储和网络。可用模块:查看完整的 Terraform 仓库以获取文档和其他资源。
先决条件
确保您已准备好以下工具/项目。部分项目标记为可选:-
LangSmith 许可证密钥
- 您可以从 LangChain 代表处获取。更多信息请联系我们的销售团队。
-
API 密钥盐值
- 这是一个您可以生成的密钥。它应该是一个随机字符串。
- 您可以使用以下命令生成:
-
JWT 密钥(可选,用于基本身份验证)
- 这是一个您可以生成的密钥。它应该是一个随机字符串。
- 您可以使用以下命令生成:
数据库
LangSmith 使用 PostgreSQL 数据库、Redis 缓存和 ClickHouse 数据库来存储追踪数据。默认情况下,这些服务会安装在您的 Kubernetes 集群内。但是,我们强烈建议使用外部数据库。对于 PostgreSQL 和 Redis,最佳选择是您云提供商的托管服务。 更多信息,请参阅以下外部服务设置指南:Kubernetes 集群要求
-
您需要一个可通过
kubectl访问的正常运行的 Kubernetes 集群。您的集群应满足以下最低要求:-
推荐:至少 16 个 vCPU,64GB 可用内存
- 您可能需要根据组织规模/使用情况调整我们所有不同服务的资源请求/限制。您可以在自托管规模指南中找到我们的建议。
- 我们建议使用集群自动扩缩器来处理基于资源使用情况的节点扩缩。
- 我们建议设置指标服务器,以便启用自动扩缩。
- 如果您在集群内运行 Clickhouse,则必须有一个至少具有 4 个 vCPU 和 16GB 可分配内存的节点,因为 ClickHouse 默认会请求此数量的资源。
-
有效的动态 PV 供应器或集群上可用的 PV(仅在集群内运行数据库时需要)
- 为了启用持久化,我们将尝试为集群内运行的任何数据库配置卷。
- 如果在集群中使用 PV,我们强烈建议在生产环境中设置备份。
- 我们强烈建议使用 SSD 支持的存储类以获得更好的性能。我们建议 7000 IOPS 和 1000 MiB/s 的吞吐量。
- 在 EKS 上,您可能需要确保已安装并配置了
ebs-csi-driver以进行动态供应。更多信息请参阅 EBS CSI 驱动程序文档。
输出应显示至少一个存储类,其供应器支持动态供应。例如:更多信息请参阅 Kubernetes 文档。我们强烈建议使用支持卷扩展的存储类。这是因为追踪数据可能占用大量磁盘空间,并且您的卷可能随时间推移需要调整大小。
-
推荐:至少 16 个 vCPU,64GB 可用内存
-
Helm
- 要安装
helm,请参阅 Helm 文档
- 要安装
-
出站访问
https://beacon.langchain.com(如果未在离线模式下运行)- LangSmith 需要出站访问
https://beacon.langchain.com以进行许可证验证和使用情况报告。这是 LangSmith 正常运行所必需的。您可以在出站访问部分找到更多关于出站要求的信息。
- LangSmith 需要出站访问
配置您的 Helm 图表:
- 使用上一步的配置选项创建一个名为
langsmith_config.yaml的新文件。- 您可以在
langsmith_config.yaml文件中设置多个配置选项。您可以在配置部分找到关于特定配置选项的更多信息。 - 如果您是 Kubernetes 或 Helm 的新手,我们建议从 Helm 图表仓库示例目录中的某个示例配置开始:LangSmith Helm 图表示例。
- 您可以在 Helm 图表仓库的
values.yaml文件中查看完整的配置选项列表:LangSmith Helm 图表
- 您可以在
-
至少,您需要设置以下配置选项(使用基本身份验证):
部署到 Kubernetes:
-
验证您可以连接到您的 Kubernetes 集群(注意:我们强烈建议安装到空命名空间中)
-
运行
kubectl get pods输出应类似于:
如果您使用的不是默认命名空间,则需要使用-n <命名空间>标志在helm和kubectl命令中指定命名空间。 -
运行
-
确保您已添加 LangChain Helm 仓库。(如果使用本地图表,请跳过此步骤)
-
查找图表的最新版本。您可以在 Helm 图表仓库中找到可用版本。
- 我们通常建议使用最新版本。
- 您也可以运行
helm search repo langchain/langsmith --versions来查看可用版本。输出将类似于:
-
运行
helm upgrade -i langsmith langchain/langsmith --values langsmith_config.yaml --version <版本> -n <命名空间> --wait --debug- 将
<命名空间>替换为您要部署 LangSmith 的命名空间。 - 将
<版本>替换为上一步中您要安装的 LangSmith 版本。大多数用户应安装可用的最新版本。
helm install命令运行并成功完成,您应该会看到类似以下的输出:这可能需要几分钟才能完成,因为它将创建多个 Kubernetes 资源并运行多个作业来初始化数据库和其他服务。 - 将
-
运行
kubectl get pods输出现在应类似于以下内容(注意确切的 Pod 名称可能因您使用的版本和配置而异):
验证您的部署:
-
运行
kubectl get services输出应类似于: -
使用 curl 访问
langsmith-frontend服务的外部 IP:预期输出: -
在浏览器中访问
langsmith-frontend服务的外部 IP LangSmith UI 应该可见/可操作
使用 LangSmith
现在 LangSmith 正在运行,您可以开始使用它来追踪您的代码。您可以在自托管使用指南中找到关于如何使用自托管 LangSmith 的更多信息。 您的 LangSmith 实例现在正在运行,但可能尚未完全设置完成。 如果您使用了基本配置之一,系统会为您创建一个默认的管理员用户账户。您可以使用在langsmith_config.yaml 文件中指定的邮箱地址和密码登录。
作为下一步,强烈建议您与您的基础设施管理员合作:
- 为您的 LangSmith 实例设置 DNS,以便更轻松地访问
- 配置 SSL 以确保提交到 LangSmith 的追踪数据在传输过程中加密
- 使用单点登录配置 LangSmith 以保护您的 LangSmith 实例
- 将 LangSmith 连接到外部 Postgres 和 Redis 实例
- 设置对象存储以存储大文件
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

