Skip to main content
如果您已准备好将应用部署到云服务,请遵循云部署快速入门完整设置指南。本页为参考目的,解释了云托管架构。
云服务选项是一个完全托管的模式,由 LangChain 托管和运营所有 LangSmith 基础设施与服务:
  • 完全托管的基础设施:LangChain 处理所有基础设施、更新、扩展和维护。
  • 从 GitHub 部署:连接您的代码仓库,点击几下即可部署。
  • 自动化 CI/CD:构建流程由平台自动处理。
  • LangSmith UI:完全访问可观测性评估部署管理Studio
管理方运行位置
LangSmith 平台 (UI, API, 数据存储)LangChainLangChain 的云端
您的智能体服务器LangChainLangChain 的云端
您应用的 CI/CDLangChainLangChain 的云端
云部署:LangChain 托管并管理所有组件,包括 UI、API 和您的智能体服务器。

开始使用

要将您的第一个应用程序部署到云服务,请遵循云部署快速入门或参考完整设置指南

云架构与可扩展性

本节仅适用于托管在 https://smith.langchain.comhttps://eu.smith.langchain.com 的云托管 LangSmith 服务。有关自托管 LangSmith 解决方案的信息,请参阅自托管文档
LangSmith 部署在 Google Cloud Platform (GCP) 上,并设计为高度可扩展。许多客户在生产工作负载中使用 LangSmith 进行 LLM 应用的可观测性、评估和智能体部署。

架构

基于美国的 LangSmith 服务部署在 GCP 的 us-central1(爱荷华州)区域。
基于欧盟的 LangSmith 服务现已可用(自 2024 年 7 月中旬起),部署在 GCP 的 europe-west4(荷兰)区域。如果您对该区域的企业计划感兴趣,请联系我们的销售团队

区域性存储

下表中的资源和服务存储在注册时所用 URL(美国或欧盟)对应的位置。云托管的 LangSmith 使用 Supabase 进行身份验证/授权,并使用 ClickHouse Cloud 作为数据仓库。
美国欧盟
URLhttps://smith.langchain.comhttps://eu.smith.langchain.com
API URLhttps://api.smith.langchain.comhttps://eu.api.smith.langchain.com
GCP 区域us-central1 (爱荷华州)europe-west4 (荷兰)
SupabaseAWS us-east-1 (弗吉尼亚北部)AWS eu-central-1 (德国)
ClickHouse Cloudus-central1 (爱荷华州)europe-west4 (荷兰)
LangSmith 部署us-central1 (爱荷华州)europe-west4 (荷兰)
更多信息请参阅区域常见问题解答

区域无关存储

此处列出的数据仅存储在美国:
  • Stripe 和 Metronome 的支付与账单信息

GCP 服务

LangSmith 由以下服务组成,全部部署在 Google Kubernetes Engine (GKE) 上:
  • LangSmith 前端:提供 LangSmith UI。
  • LangSmith 后端:提供 LangSmith API。
  • LangSmith 平台后端:处理身份验证和其他高容量任务。(内部服务)
  • LangSmith Playground:处理向各种 LLM 提供商转发请求以支持 Playground 功能。
  • LangSmith 队列:处理异步任务的处理。(内部服务)
LangSmith 使用以下 GCP 存储服务:
  • Google Cloud Storage (GCS) 用于运行输入和输出。
  • Google Cloud SQL PostgreSQL 用于事务性工作负载。
  • Google Cloud Memorystore for Redis 用于队列和缓存。
  • GCP 上的 Clickhouse Cloud 用于追踪数据摄取和分析。我们的服务通过私有端点连接到托管在同一 GCP 区域的 Clickhouse Cloud。
我们使用的一些其他 GCP 服务包括:
  • Google Cloud Load Balancer 用于将流量路由到 LangSmith 服务。
  • Google Cloud CDN 用于缓存静态资源。
  • Google Cloud Armor 用于安全和速率限制。有关我们实施的速率限制的更多信息,请参阅速率限制
浅色模式概览

允许列表 IP 地址

从 LangChain SaaS 流出

所有离开 LangSmith 服务的流量都将通过 NAT 网关路由。所有流量将显示为来自以下 IP 地址:
美国欧盟
34.59.65.9734.13.192.67
34.67.51.22134.147.105.64
34.46.212.3734.90.22.166
34.132.150.8834.147.36.213
35.188.222.20134.32.137.113
34.58.194.12734.91.238.184
34.59.97.17335.204.101.241
104.198.162.5535.204.48.32
如果您连接到自己的 AzureOpenAI 服务或 Playground 或在线评估可能需要的其他端点,将这些 IP 地址加入允许列表可能会有所帮助。

进入 LangChain SaaS

langchain 端点映射到以下静态 IP 地址:
美国欧盟
34.8.121.3934.95.92.214
34.107.251.23434.13.73.122
您可能需要将这些 IP 地址加入允许列表,以启用从您的私有网络到 LangSmith SaaS 端点(api.smith.langchain.comsmith.langchain.combeacon.langchain.comeu.api.smith.langchain.comeu.smith.langchain.comeu.beacon.langchain.com)的流量。

私有服务连接 (企业版)

仅限企业版。 私有服务连接仅适用于企业版客户。请联系您的客户代表或 sales@langchain.dev 以启用此功能。
GCP 上的企业版客户可以通过私有服务连接 (PSC) 连接到 LangSmith,提供私有连接,而无需将流量暴露到公共互联网。

服务附件 URI

使用以下服务附件 URI 在您的 VPC 中创建 PSC 端点:
区域服务附件 URI
美国 (us-central1)projects/langchain-prod/regions/us-central1/serviceAttachments/gateway-psc-publish
欧盟 (europe-west4)projects/langchain-prod/regions/europe-west4/serviceAttachments/gateway-psc-publish

PSC 域名

设置完成后,使用以下域名通过您的 PSC 连接连接到 LangSmith:
区域域名
美国us-central1.p.api.smith.langchain.com
欧盟europe-west4.p.api.smith.langchain.com

设置

请求访问权限: 联系您的客户代表或 sales@langchain.dev 并提供您的 GCP 项目 ID。LangChain 会将您的项目添加到服务附件的允许消费者列表中。 授予访问权限后,使用 gcloud CLI 或 Terraform 创建 PSC 端点并配置 DNS。

创建 PSC 端点

在您的 VPC 中创建一个指向服务附件的转发规则:
# 创建 PSC 端点
gcloud compute forwarding-rules create langsmith-psc-endpoint \
  --region=<REGION> \
  --network=<YOUR_VPC_NETWORK> \
  --subnet=<YOUR_SUBNET> \
  --target-service-attachment=projects/langchain-prod/regions/<REGION>/serviceAttachments/gateway-psc-publish \
  --load-balancing-scheme=""

# 获取分配的 IP 地址
gcloud compute forwarding-rules describe langsmith-psc-endpoint \
  --region=<REGION> \
  --format="value(IPAddress)"

配置 DNS

在您的 VPC 中创建一个私有 DNS 区域,并添加一条指向 PSC 端点 IP 的 A 记录:
# 创建私有 DNS 区域
gcloud dns managed-zones create langsmith-psc \
  --dns-name="<REGION>.p.api.smith.langchain.com." \
  --visibility=private \
  --networks=<YOUR_VPC_NETWORK>

# 添加一条指向 PSC 端点 IP 的 A 记录
gcloud dns record-sets create "<REGION>.p.api.smith.langchain.com." \
  --zone=langsmith-psc \
  --type=A \
  --rrdatas=<PSC_ENDPOINT_IP>

验证连接

从您的 VPC 中的一台虚拟机:
curl https://<REGION>.p.api.smith.langchain.com/ok

API 速率限制

LangSmith 对 API 端点实施速率限制,以确保服务稳定性和公平使用。下表显示了美国和欧盟区域不同端点的速率限制。请注意:
  • 速率限制表示为 计数 / 间隔,其中计数是间隔(以秒为单位)内允许的请求数。例如,2000 / 10 表示每 10 秒 2000 个请求。
  • 当端点列中未指定 HTTP 方法时,速率限制适用于该端点的所有 HTTP 方法。
  • 当列出特定方法(例如 POSTGET)时,速率限制仅适用于该方法。
匹配 / 端点 (方法)身份标识键美国生产环境限制欧盟生产环境限制类别
OPTIONS, /info, */v1/metadata/submitIP2000 / 102000 / 10高吞吐量
/authx-api-key2000 / 102000 / 10高吞吐量
/authx-user-id + IP2000 / 102000 / 10高吞吐量
/v1/beaconIP2000 / 102000 / 10高吞吐量
/reposx-api-key100 / 60100 / 60仓库
/reposx-user-id + IP100 / 60100 / 60仓库
POST /runs/batchx-api-key2000 / 102000 / 10高吞吐量
POST /otel/v1/tracesx-api-key2000 / 102000 / 10运行数据摄取
POST 包含 /chartsx-api-key750 / 600750 / 600图表
POST 包含 /chartsx-user-id + IP750 / 600750 / 600图表
POST /runs/multipartx-api-key6000 / 106000 / 10多部分数据摄取
POST /runs/queryx-api-key15 / 1015 / 10运行查询 (API)
POST /runs/queryx-user-id + IP300 / 10300 / 10运行查询 (用户)
/generatex-api-key30 / 360030 / 3600生成
/generatex-user-id + IP30 / 360030 / 3600生成
/commitsx-api-key10000 / 602000 / 60提交
/commitsx-user-id + IP10000 / 602000 / 60提交
DELETE /sessions*/triggerx-api-key10 / 6010 / 60删除
DELETE /sessions*/triggerx-user-id + IP30 / 6030 / 60删除
POST /runs (单次运行数据摄取)x-api-key2000 / 102000 / 10运行数据摄取
PATCH 包含 /runsx-api-key2000 / 102000 / 10运行数据摄取
POST /feedbackx-api-key2000 / 102000 / 10高吞吐量
GET /runs/{uuid}/api/v1/runs/{uuid}x-api-key30 / 6030 / 60运行查找
GET 包含 /examplesx-api-key5000 / 605000 / 60示例
任何带有 x-api-key 的请求x-api-key1000 / 101000 / 10默认 (API 密钥)
任何带有 x-user-id 的请求x-user-id + IP1000 / 101000 / 10默认 (用户)
/public/downloadIP5000 / 605000 / 60公共下载
/runs/statsx-api-key1 / 1020 / 10统计
所有其他 IP (兜底)IP100 / 60100 / 60公共 (兜底)

速率限制类别

  • 高吞吐量:用于核心操作(如身份验证、元数据和反馈)的通用高容量端点。
  • 仓库:仓库和提示管理操作。
  • 运行数据摄取:用于可观测性的单个追踪/运行数据摄取端点。
  • 图表:图表生成和可视化端点。
  • 多部分数据摄取:通过多部分上传进行批量运行数据摄取,用于高容量追踪。
  • 运行查询 (API):基于 API 密钥的运行查询操作,对复杂查询有更严格的限制。
  • 运行查询 (用户):基于用户的运行查询操作,为交互式使用提供更高的限制。
  • 生成:AI 驱动的代码和内容生成端点(为防止滥用而限制)。
  • 提交:提示版本控制和提交操作。
  • 删除:会话删除和工作流触发操作。
  • 运行查找:按 UUID 检索特定运行。
  • 示例:为少样本提示获取数据集示例。
  • 默认 (API 密钥):未匹配特定模式的已认证 API 请求的兜底速率限制。
  • 默认 (用户):未匹配特定模式的已认证用户请求的兜底速率限制。
  • 公共下载:用于共享资源的高容量公共下载端点。
  • 统计:运行统计和分析端点(应用区域特定限制)。
  • 公共 (兜底):未经身份验证的公共访问的默认速率限制。
有关速率限制和其他服务限制的更多信息,请参阅管理概述