4

我正在使用 Luigi 创建一个数据管道,并尝试将处理后的数据直接写入 S3 存储桶。我使用的代码是:

import luigi
from luigi.s3 import S3Target, S3Client

class myTask(luigi.Task):
    def requires(self):
        return otherTask()

    def output(self):
        client = S3Client('ACCESS_KEY', 'SECRET_KEY')
        return S3Target('s3.amazonaws.com/mybucket/myfolder/myfile.tsv', client=client)

    def run(self):
         fo = self.output().open('w')
         with self.input().open('r') as f:
            data = dosomething_to_input(f)
            fo.write(data)
         fo.close()

运行脚本后,出现错误:

S3ResponseError: S3ResponseError: 405 Method Not Allowed

我们可以直接将文件写入 S3 存储桶吗?

4

1 回答 1

4

问题解决了!这是因为 s3 buckt 的格式。正确的格式应该是 's3://mybucket/myfile' 405 ERROR 是由于 boto 无法识别存储桶名称引起的。还需要提一下,boto 无法识别带有 '.' 的存储桶名称。在 Python 2.7.* 中,因此您必须使用有效的存储桶名称或在配置文件中更改它。

于 2016-05-12T16:24:27.763 回答