我正在尝试将数据从 s3 中的大量文件复制到 Redshift。我对包含这些文件的 s3 存储桶具有只读访问权限。为了有效地复制它们,我创建了一个清单文件,其中包含指向我需要复制的每个文件的链接。
Bucket 1:
- file1.gz
- file2.gz
- ...
Bucket 2:
- manifest
这是我尝试使用存储桶 2 中的清单从存储桶 1 复制数据的命令:
-- Load data from s3
copy data_feed_eval from 's3://bucket-2/data_files._manifest'
CREDENTIALS 'aws_access_key_id=bucket_1_key;aws_secret_access_key=bucket_1_secret'
manifest
csv gzip delimiter ',' dateformat 'YYYY-MM-DD' timeformat 'YYYY-MM-DD HH:MI:SS'
maxerror 1000 TRUNCATECOLUMNS;
但是,在运行此命令时,我收到以下错误:
09:45:32 [COPY - 0 rows, 7.576 secs] [Code: 500310, SQL State: XX000] [Amazon](500310) Invalid operation: Problem reading manifest file - S3ServiceException:Access Denied,Status 403,Error AccessDenied,Rid 901E02533CC5010D,ExtRid tEvf/TVfZzPfSNAFa8iTYjTBjvaHnMMPmuwss58SwopY/sZSkhUBe3yMGHTDyA0yDhDCD7ybX9gl45pV/eQ=,CanRetry 1
Details:
-----------------------------------------------
error: Problem reading manifest file - S3ServiceException:Access Denied,Status 403,Error AccessDenied,Rid 901E02533CC5010D,ExtRid tEvf/TVfZzPfSNAFa8iTYjTBjvaHnMMPmuwss58SwopY/sZSkhUBe3yMGHTDyA0yDhDCD7ybX9gl45pV/eQ=,CanRetry 1
code: 8001
context: s3://bucket-2/data_files._manifest
query: 2611231
location: s3_utility.cpp:284
process: padbmaster [pid=10330]
-----------------------------------------------;
我相信这里的问题是我在我的 COPY 命令中传递了 bucket_1 凭据。是否可以将多个存储桶的凭据(带有实际文件的 bucket_1 和带有清单的 bucket_2)传递给 COPY 命令?假设我没有对 bucket_1 的写入权限,我应该如何处理这个问题?