Skip to main content
LangSmith 支持多种实验配置选项:

重复次数

重复次数 通过多次运行实验来考量 LLM 输出的变异性。由于 LLM 输出具有非确定性,多次重复能提供更准确的性能评估。 通过向 evaluate / aevaluate 传递 num_repetitions 参数来配置重复次数(Python, TypeScript)。每次重复都会重新运行目标函数和所有评估器。 了解更多信息,请参阅重复次数操作指南

并发控制

并发控制 用于管理实验期间同时运行的示例数量。通过向 evaluate / aevaluate 传递 max_concurrency 参数进行配置。这两个函数的语义有所不同:

evaluate

max_concurrency 参数指定运行目标函数和评估器时的最大并发线程数。

aevaluate

max_concurrency 参数使用信号量来限制并发任务数。aevaluate 为每个示例创建一个任务,每个任务会运行该示例的目标函数和所有评估器。max_concurrency 参数指定了同时处理的示例最大数量。

缓存机制

缓存机制 将 API 调用结果存储到磁盘,以加速未来的实验。将环境变量 LANGSMITH_TEST_CACHE 设置为具有写入权限的有效文件夹路径。未来进行相同 API 调用的实验将复用缓存结果,而无需发起新的请求。