可观测性概念 - LangChain中文版文档

本页介绍了将追踪记录到 LangSmith 时需要理解的关键概念。一次追踪记录了您的应用程序从接收输入、经过中间处理到产生最终输出的步骤序列。追踪中的每个步骤由一个运行表示。多个追踪在项目中被分组在一起，而多轮对话中的追踪可以链接在一起作为一个线程。下图在一个简单的 RAG 应用（从索引中检索文档并生成答案）的上下文中展示了这些概念。

运行

一个运行是一个跨度，代表您的 LLM 应用程序中的一个工作单元或操作。这可以是任何内容，从对 LLM 或链的单个调用，到提示格式化调用，再到可运行 lambda 的调用。如果您熟悉 OpenTelemetry，可以将运行视为一个跨度。

追踪

一个追踪是单个操作的一系列运行的集合。例如，如果有一个用户请求触发了一个链，该链调用了 LLM，然后调用了输出解析器等，那么所有这些运行都属于同一个追踪。如果您熟悉 OpenTelemetry，可以将 LangSmith 追踪视为一系列跨度的集合。运行通过唯一的追踪 ID 绑定到追踪。

每条追踪最多限制为 25,000 次运行。一旦该追踪达到此限制，LangSmith 将拒绝您为此追踪发送的任何额外运行。

线程

一个线程是代表单个对话的一系列追踪。许多 LLM 应用程序具有类似聊天机器人的界面，用户和 LLM 应用程序在其中进行多轮对话。对话中的每一轮都表示为其自己的追踪，但这些追踪通过属于同一个线程而链接在一起。线程中最新的追踪是最新的消息交换。要将追踪分组到线程中，您需要传递一个特殊的元数据键（session_id、thread_id 或 conversation_id）以及一个唯一的标识符值，该值将追踪链接在一起。了解如何配置线程。

使用 Polly 来分析追踪、运行和线程。Polly 帮助您理解代理性能、调试问题并从对话线程中获得洞察，而无需手动挖掘数据。

项目

一个项目是一系列追踪的集合。您可以将项目视为与单个应用程序或服务相关的所有追踪的容器。您可以拥有多个项目，每个项目可以包含多个追踪。

有关项目设置和追踪的更多详细信息，请参阅将追踪记录到项目。

反馈

反馈允许您根据特定标准对单个运行进行评分。每个反馈条目由一个反馈标签和反馈分数组成，并通过唯一的运行 ID 绑定到运行。反馈可以是连续的或离散的（分类的），您可以在组织内的不同运行中重复使用反馈标签。您可以通过多种方式收集对运行的反馈：

从 LLM 应用程序随追踪一起发送。
由用户在应用程序中内联或在标注队列中生成。
在离线评估期间由自动评估器生成。
由在线评估器生成。

要了解有关反馈在应用程序中如何存储的更多信息，请参阅反馈数据格式指南。

元数据

元数据 是可以附加到运行的键值对集合。您可以使用元数据存储有关运行的附加信息，例如生成运行的应用程序版本、生成运行的环境，或您希望与运行关联的任何其他信息。与标签类似，您可以使用元数据在 LangSmith UI 中过滤运行或将运行分组以进行分析。了解如何向您的追踪添加元数据。

数据存储与保留

对于 2024 年 5 月 22 日（星期三）或之后摄取的追踪，LangSmith (SaaS) 将追踪数据保留最多 400 天，从追踪插入 LangSmith 追踪数据库的日期和时间算起。 400 天后，追踪将从 LangSmith 中永久删除，仅保留少量元数据用于显示准确的统计数据，例如历史使用情况和成本。有关数据保留层级、定价和自动升级场景的更多信息，请参阅使用与计费：数据保留。

如果您希望将追踪数据保留超过数据保留期限，可以将其添加到数据集中。数据集允许您存储追踪的输入和输出（例如，作为键值数据集），并且将永久保存，即使在追踪被删除后也是如此。

要在到期日期之前删除追踪，请参阅管理追踪。

Edit this page on GitHub or file an issue.

Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

​运行

​追踪

​线程

​项目

​反馈

​标签

​元数据

​数据存储与保留

运行

追踪

线程

项目

反馈

标签

元数据

数据存储与保留