概述
Spider 允许您使用高性能代理来防止被检测,缓存 AI 操作,通过 Webhook 获取爬取状态,安排定时爬取等。 本指南展示了如何使用 Spider 来爬取/抓取网站,并通过 LangChain 中的SpiderLoader 加载可用于 LLM 的文档。
设置
在 spider.cloud 上获取您自己的 Spider API 密钥。使用方法
以下是如何使用SpiderLoader 的示例:
Spider 提供两种抓取模式:scrape 和 crawl。scrape 仅获取所提供 URL 的内容,而 crawl 则获取所提供 URL 的内容并进一步爬取子页面。
额外参数
有关所有可用params 的详细信息,请参阅 Spider 文档。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

