Skip to main content
兼容性说明仅适用于 Node.js 环境。
本文介绍如何从 S3 文件对象加载文档对象。

环境设置

要运行此索引,你需要先配置好 Unstructured 服务,并确保其在一个可访问的 URL 端点就绪。也可以配置为本地运行。 有关如何配置的详细信息,请参阅 Unstructured 文件加载器文档 你还需要安装官方的 AWS SDK:
npm
npm install @langchain/community @langchain/core @aws-sdk/client-s3

使用方法

配置好 Unstructured 后,你可以使用 S3 加载器来加载文件,并将其转换为 Document 对象。 你可以选择性地提供 s3Config 参数来指定你的存储桶区域、访问密钥和秘密访问密钥。如果不提供这些参数,则需要在环境中配置它们(例如通过运行 aws configure 命令)。
import { S3Loader } from "@langchain/community/document_loaders/web/s3";

const loader = new S3Loader({
  bucket: "my-document-bucket-123",
  key: "AccountingOverview.pdf",
  s3Config: {
    region: "us-east-1",
    credentials: {
      accessKeyId: "AKIAIOSFODNN7EXAMPLE",
      secretAccessKey: "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY",
    },
  },
  unstructuredAPIURL: "http://localhost:8000/general/v0/general",
  unstructuredAPIKey: "", // 此参数即将成为必填项
});

const docs = await loader.load();

console.log(docs);