如何创建复合评估器 - LangChain中文版文档

复合评估器 是一种将多个评估器得分合并为单一得分的方法。当您希望评估应用的多个方面并将结果合并为单一结果时，这非常有用。本指南将向您展示如何使用 LangSmith UI 定义复合评估器。

如需使用 SDK 以编程方式创建复合评估器，请参阅如何创建复合评估器 (SDK)。

创建复合评估器

您可以在追踪项目（用于在线评估）或数据集（用于离线评估）上创建复合评估器。通过 UI 中的复合评估器，您可以计算多个评估器得分的加权平均值或加权总和，并配置权重。

要开始配置复合评估器，请导航至 追踪项目 或 数据集与实验 标签页，并选择一个项目或数据集。

如果您需要调整复合得分的权重，可以在评估器创建后进行更新。配置了该评估器的所有运行的结果得分都将被更新。

复合得分会作为反馈附加到运行上，类似于单个评估器的反馈。查看方式取决于评估运行的位置： 在追踪项目上：

在数据集上：

如果运行中未配置任何组成评估器，则不会为该运行计算复合得分。

Connect these docs to Claude, VSCode, and more via MCP for real-time answers.