FireCrawlLoader 文档加载器 的简要概述。有关 FireCrawlLoader 所有功能和配置的详细文档,请参阅 API 参考。
概述
集成详情
| 类 | 包 | 本地 | 可序列化 | Python 支持 |
|---|---|---|---|---|
FireCrawlLoader | @langchain/community | 🟠 (详见下文) | beta | ✅ |
加载器特性
| 来源 | 网页加载器 | 仅限 Node 环境 |
|---|---|---|
FireCrawlLoader | ✅ | ❌ |
FireCrawlLoader 来抓取和爬取整个网站并加载它们。
设置
要使用FireCrawlLoader 文档加载器,您需要安装 @langchain/community 集成包以及 @mendable/firecrawl-js@0.0.36 包。然后创建一个 FireCrawl 账户并获取 API 密钥。
凭证
注册并获取免费的 FireCrawl API 密钥 以开始使用。FireCrawl 提供 300 个免费积分供您起步,并且它是 开源 的,如果您想自行托管的话。 完成此步骤后,设置FIRECRAWL_API_KEY 环境变量:
安装
LangChain 的 FireCrawlLoader 集成位于@langchain/community 包中:
实例化
以下是如何使用FireCrawlLoader 加载网页搜索结果的示例:
Firecrawl 提供 3 种模式:scrape、crawl 和 map。在 scrape 模式下,Firecrawl 仅抓取您提供的页面。在 crawl 模式下,Firecrawl 将爬取整个网站。在 map 模式下,Firecrawl 将返回与网站相关的语义链接。
formats 参数(crawl 模式下为 scrapeOptions.formats)允许选择 "markdown"、"html" 或 "rawHtml"。但是,加载的文档将仅返回一种格式的内容,优先级如下:markdown,然后是 html,最后是 rawHtml。
现在我们可以实例化模型对象并加载文档:
加载
附加参数
对于params,您可以根据 Firecrawl 文档 传递任何参数。
API 参考
有关FireCrawlLoader 所有功能和配置的详细文档,请参阅 API 参考。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

