Skip to main content
LangSmith 允许您创建带有文件附件(如图像、音频文件或文档)的数据集示例,并在运行包含多模态内容的评估时,在提示词和评估器中使用它们。 虽然您可以通过 base64 编码在多模态示例中包含数据,但这种方法效率较低——编码后的数据比原始二进制文件占用更多空间,导致与 LangSmith 之间的传输速度变慢。使用附件则带来两个关键优势:
  • 由于更高效的二进制文件传输,上传和下载速度更快。
  • 在 LangSmith UI 中增强了对不同文件类型的可视化展示。
本指南涵盖如何创建带有附件的示例、构建使用这些附件的多模态提示词和评估器,以及运行包含多模态内容的评估——选择 UISDK 标签页开始操作。 选择您偏好的方法:

1. 创建带有附件的示例

您可以通过几种不同的方式向数据集添加带有附件的示例。

从现有运行记录添加

将运行记录添加到 LangSmith 数据集时,可以选择性地将附件从源运行记录传播到目标示例。要了解更多信息,请参阅在应用中管理数据集将带有附件的追踪记录添加到数据集

从头创建

您可以直接从 LangSmith UI 创建带有附件的示例。点击数据集 UI 中 Examples 标签页的 + Example 按钮。然后使用“上传文件”按钮上传附件:创建带有附件的示例上传后,您可以在 LangSmith UI 中查看带有附件的示例。每个附件都会以预览形式呈现,便于检查。带有附件的示例

2. 创建多模态提示词

LangSmith UI 允许您在评估多模态模型时,在提示词中包含附件:首先,点击您想要添加多模态内容的消息中的文件图标。接着,为每个示例添加要包含的附件的模板变量。
  • 如果您想包含特定附件,可以使用建议的变量名,例如 {{attachment.file_name}},这将映射附件列表中名为 file_name 的文件,并将其传递给评估器。
  • 如果您想包含所有附件,请使用 {{attachments}} 变量。 添加多模态变量

3. 定义自定义评估器

您可以创建使用数据集示例中多模态内容的评估器。由于您的数据集已包含带有附件的示例(在步骤 1 中添加),您可以直接在评估器中引用它们。操作如下:
  1. 从数据集页面选择 + Evaluator
  2. Template variables 编辑器中,添加要包含的附件变量:
    • 如果您想包含特定附件,可以使用建议的变量名,例如 {{attachment.file_name}},这将映射附件列表中名为 file_name 的文件,并将其传递给评估器。
    • 如果您想包含所有附件,请使用 {{attachments}} 变量。
    创建评估器模态框,其中为输出变量选择了一个音频附件。
然后,评估器可以使用这些附件以及模型的输出来判断质量。例如,您可以创建一个评估器来:
  • 检查图像描述是否与实际图像内容匹配。
  • 验证转录是否准确反映了音频内容。
  • 确认从 PDF 中提取的文本是否正确。
您也可以创建不使用附件、仅评估模型文本输出的纯文本评估器:
  • OCR → 文本校正:使用视觉模型从文档中提取文本,然后评估提取输出的准确性。
  • 语音转文字 → 转录质量:使用语音模型将音频转录为文本,然后根据您的参考评估转录结果。
如果您的追踪记录在输入或输出中包含 base64 编码的多模态内容(例如,如果您遵循了记录多模态追踪记录指南),则无需附件即可评估它们。在评估器提示词中使用标准变量映射——例如 {{input}}{{output}}——base64 内容将正确传递给 LLM 评估器进行可视化和评估。
有关定义自定义评估器的更多信息,请参阅 LLM 作为评判器指南。

4. 更新带有附件的示例

UI 中附件大小限制为 20MB。
在 UI 中编辑示例时,您可以:
  • 上传新附件
  • 重命名和删除附件
  • 使用快速重置按钮将附件重置到之前的状态
更改在您点击提交之前不会保存。附件编辑