StarRocks 是一款高性能分析型数据库。
StarRocks 是一款面向全场景分析的下一代亚秒级 MPP 数据库,包括多维分析、实时分析和即席查询。
通常 StarRocks 被归类为 OLAP,并且在 ClickBench — 分析型数据库基准测试 中展示了卓越的性能。由于它拥有超快的向量化执行引擎,它也可以用作快速的向量数据库。
在这里我们将展示如何使用 StarRocks 向量存储。
设置
update_vectordb = False。如果没有文档更新,则不需要重新构建文档的嵌入。
加载文档并将其拆分为 token
加载docs 目录下的所有 markdown 文件
对于 StarRocks 文档,您可以从 github.com/StarRocks/starrocks 克隆仓库,其中包含 docs 目录。
update_vectordb = True,因为存在新文档/token。
创建向量数据库实例
使用 StarRocks 作为向量数据库
将 token 转换为嵌入并放入向量数据库
这里我们使用 StarRocks 作为向量数据库,您可以通过StarRocksSettings 配置 StarRocks 实例。
配置 StarRocks 实例与配置 MySQL 实例非常相似。您需要指定:
- host/port
- username(default: ‘root’)
- password(default: ”)
- database(default: ‘default’)
- table(default: ‘langchain’)
构建问答系统并向其提问
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

