少量示例的工作原理
- 少量示例通过
{{Few-shot examples}}变量添加到评估器提示中 - 创建带有少量示例的评估器时,系统会自动为您创建一个数据集,一旦开始进行修正,该数据集将自动填充少量示例
- 在运行时,这些示例将被插入到评估器中,作为其输出的指导——这将帮助评估器更好地与人工偏好保持一致
配置评估器
少量示例目前不支持使用提示中心(prompt hub)的 LLM 作为评估器,仅兼容使用 Mustache 格式的提示。
1. 配置变量映射
每个少量示例都根据配置中指定的变量映射进行格式化。少量示例的变量映射应包含与主提示相同的变量,外加一个few_shot_explanation 变量和一个 score 变量,该变量应与您的反馈键(feedback key)同名。
例如,如果您的主提示包含变量 question 和 response,并且您的评估器输出一个 correctness 分数,那么您的少量示例提示应包含变量 question、response、few_shot_explanation 和 correctness。
2. 指定使用的少量示例数量
您还可以指定要使用的少量示例数量。默认值为 5。如果您的示例非常长,您可能希望将此数字设置得更低以节省令牌;而如果您的示例通常较短,则可以设置更高的数字,以便为评估器提供更多学习示例。如果您的数据集中有超过此数量的示例,系统将随机为您选择。进行修正
当您开始记录追踪或运行实验时,您可能会对评估器给出的某些分数持有不同意见。当您对这些分数进行修正时,您将开始看到修正数据集中填充的示例。在进行修正时,请务必附上解释——这些解释将替换few_shot_explanation 变量,填充到您的评估器提示中。
少量示例的输入将来自您的链/数据集的输入、输出和参考(如果这是离线评估器)中的相关字段。输出将是修正后的评估器分数以及您在留下修正时创建的解释。您可以随意编辑这些内容。以下是一个修正数据集中少量示例的示例:

查看修正数据集
要查看您的修正数据集:- 在线评估器:选择您的运行规则并点击 编辑规则
- 离线评估器:选择您的评估器并点击 编辑评估器


Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

