设置
要访问 Databricks 模型,您需要创建一个 Databricks 账户,设置凭据(如果您在 Databricks 工作区之外),并安装所需的包。凭据(仅当您不在 Databricks 内部时)
如果您在 Databricks 内部运行 LangChain 应用,可以跳过此步骤。 否则,您需要手动将 Databricks 工作区主机名和个人访问令牌分别设置为DATABRICKS_HOST 和 DATABRICKS_TOKEN 环境变量。请参阅 身份验证文档 了解如何获取访问令牌。
安装
LangChain Databricks 集成位于databricks-langchain 包中。
创建向量搜索端点和索引(如果尚未创建)
在本节中,我们将使用客户端 SDK 创建 Databricks Vector Search 端点和索引。 如果您已经有了端点和索引,可以跳过本节,直接进入“实例化”部分。 首先,实例化 Databricks VectorSearch 客户端:DatabricksVectorSearch 类支持这两种用例。
- Delta Sync Index 会自动与源 Delta 表同步,随着 Delta 表底层数据的变化自动增量更新索引。
- Direct Vector Access Index 支持向量和元数据的直接读写。用户负责使用 REST API 或 Python SDK 更新此表。
实例化
DatabricksVectorSearch 的实例化略有不同,取决于您的索引是使用 Databricks 托管的嵌入还是自托管嵌入,即您选择的 LangChain Embeddings 对象。
如果您使用的是带有 Databricks 托管嵌入的 delta-sync 索引:
管理向量存储
向向量存储添加项
注意:通过add_documents 方法向向量存储添加项仅支持 直接访问 索引。
从向量存储删除项
注意:通过delete 方法从向量存储删除项仅支持 直接访问 索引。
查询向量存储
一旦创建了向量存储并添加了相关文档,您很可能希望在运行链或代理期间对其进行查询。直接查询
执行简单的相似度搜索可以如下所示:columns 参数中传递额外的列。
转换为检索器进行查询
您还可以将向量存储转换为检索器,以便在链中更轻松地使用。检索增强生成 (RAG) 用法
关于如何使用此向量存储进行检索增强生成 (RAG) 的指南,请参见以下部分:API 参考
有关所有DatabricksVectorSearch 功能和配置的详细文档,请访问 API 参考:api-docs.databricks.com/python/databricks-ai-bridge/latest/databricks_langchain.html#databricks_langchain.DatabricksVectorSearch
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

