Skip to main content
本页介绍了将追踪记录到 LangSmith 时需要理解的关键概念。 一次 追踪 记录了您的应用程序从接收输入、经过中间处理到产生最终输出的步骤序列。追踪中的每个步骤由一个 运行 表示。多个追踪在 项目 中被分组在一起,而多轮对话中的追踪可以链接在一起作为一个 线程 下图在一个简单的 RAG 应用(从索引中检索文档并生成答案)的上下文中展示了这些概念。 LangSmith 项目、追踪、运行在问答 RAG 应用上下文中的基本概念图示。

运行

一个 运行 是一个跨度,代表您的 LLM 应用程序中的一个工作单元或操作。这可以是任何内容,从对 LLM 或链的单个调用,到提示格式化调用,再到可运行 lambda 的调用。如果您熟悉 OpenTelemetry,可以将运行视为一个跨度。 LangSmith UI 中的运行详情页面。

追踪

一个 追踪 是单个操作的一系列运行的集合。例如,如果有一个用户请求触发了一个链,该链调用了 LLM,然后调用了输出解析器等,那么所有这些运行都属于同一个追踪。如果您熟悉 OpenTelemetry,可以将 LangSmith 追踪视为一系列跨度的集合。运行通过唯一的追踪 ID 绑定到追踪。 LangSmith UI 中显示单个运行的追踪视图。
Each trace is limited to a maximum of 25,000 runs. Once the trace reaches this limit, LangSmith will reject any additional runs that you send for that trace.

线程

一个 线程 是代表单个对话的一系列追踪。许多 LLM 应用程序具有类似聊天机器人的界面,用户和 LLM 应用程序在其中进行多轮对话。对话中的每一轮都表示为其自己的追踪,但这些追踪通过属于同一个线程而链接在一起。线程中最新的追踪是最新的消息交换。 要将追踪分组到线程中,您需要传递一个特殊的元数据键(session_idthread_idconversation_id)以及一个唯一的标识符值,该值将追踪链接在一起。 了解如何配置线程 代表多轮对话中一系列追踪的线程视图。
使用 Polly 来分析追踪、运行和线程。Polly 帮助您理解代理性能、调试问题并从对话线程中获得洞察,而无需手动挖掘数据。

项目

一个 项目 是一系列追踪的集合。您可以将项目视为与单个应用程序或服务相关的所有追踪的容器。您可以拥有多个项目,每个项目可以包含多个追踪。 LangSmith UI 中包含追踪的项目视图,表格顶部有 + 项目按钮。 有关项目设置和追踪的更多详细信息,请参阅 将追踪记录到项目

反馈

反馈 允许您根据特定标准对单个运行进行评分。每个反馈条目由一个反馈标签和反馈分数组成,并通过唯一的运行 ID 绑定到运行。反馈可以是连续的或离散的(分类的),您可以在组织内的不同运行中重复使用反馈标签。 您可以通过多种方式收集对运行的反馈:
  1. 从 LLM 应用程序 随追踪一起发送
  2. 由用户在应用程序中 内联 或在 标注队列 中生成。
  3. 离线评估 期间由自动评估器生成。
  4. 在线评估器 生成。
要了解有关反馈在应用程序中如何存储的更多信息,请参阅 反馈数据格式指南

标签

标签 是可以附加到运行的字符串集合。您可以在 LangSmith UI 中使用标签执行以下操作:
  • 对运行进行分类以便于搜索。
  • 过滤运行。
  • 将运行分组以进行分析。
了解如何将标签附加到您的追踪

元数据

元数据 是可以附加到运行的键值对集合。您可以使用元数据存储有关运行的附加信息,例如生成运行的应用程序版本、生成运行的环境,或您希望与运行关联的任何其他信息。与标签类似,您可以使用元数据在 LangSmith UI 中过滤运行或将运行分组以进行分析。 了解如何向您的追踪添加元数据 LangSmith UI 中运行的元数据视图。

数据存储与保留

对于 2024 年 5 月 22 日(星期三)或之后摄取的追踪,LangSmith (SaaS) 将追踪数据保留最多 400 天,从追踪插入 LangSmith 追踪数据库的日期和时间算起。 400 天后,追踪将从 LangSmith 中永久删除,仅保留少量元数据用于显示准确的统计数据,例如历史使用情况和成本。 有关数据保留层级、定价和自动升级场景的更多信息,请参阅 使用与计费:数据保留
如果您希望将追踪数据保留超过数据保留期限,可以将其添加到数据集中。数据集 允许您存储追踪的输入和输出(例如,作为键值数据集),并且将永久保存,即使在追踪被删除后也是如此。
要在到期日期之前删除追踪,请参阅 管理追踪