- 收集器,例如 OpenTelemetry、FluentBit 或 Prometheus。
- 可观测性后端,例如 Datadog 或 Grafana 生态系统。
日志:OTel 示例
LangSmith 自托管部署中的所有服务都会将日志写入其节点文件系统和标准输出。要访问这些日志,您需要设置收集器以从文件系统或标准输出读取。大多数流行的收集器都支持从文件系统读取日志。- OpenTelemetry:文件日志接收器
- FluentBit:尾部输入
- Datadog:Kubernetes 日志收集
指标:OTel 示例
LangSmith 服务
以下 LangSmith 服务在端点以 Prometheus 指标格式公开指标。前端目前不公开指标。- 后端:
http://<langsmith_release_name>-backend.<namespace>.svc.cluster.local:1984/metrics - 平台后端:
http://<langsmith_release_name>-platform-backend.<namespace>.svc.cluster.local:1986/metrics - Playground:
http://<langsmith_release_name>-playground.<namespace>.svc.cluster.local:1988/metrics - (仅限 LangSmith 控制平面)主机后端:
http://<langsmith_release_name>-host-backend.<namespace>.svc.cluster.local:1985/metrics
前端 Nginx
前端服务在以下端点公开其 Nginx 指标:langsmith-frontend.langsmith.svc.cluster.local:80/nginx_status。您可以自行抓取这些指标,或者启动一个 Prometheus Nginx 导出器。
Postgres + Redis
如果您使用集群内的 Postgres/Redis 实例,可以使用 Prometheus 导出器从您的实例公开指标。您可以部署 Postgres 导出器 和/或 Redis 导出器。Clickhouse
集群内的 Clickhouse 已配置为无需导出器即可公开指标。您可以使用收集器在http://<langsmith_release_name>-clickhouse.<namespace>.svc.cluster.local:9363/metrics 抓取指标。
追踪:OTel 示例
LangSmith 后端、平台后端、Playground 和 LangSmith 队列部署已进行插桩以发出 Otel 追踪。追踪功能默认关闭,可以通过在您的langsmith_config.yaml(或等效文件)中添加以下配置为所有 LangSmith 服务启用:
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

