0

我的数据位于结构 s3n://bucket/{date}/{file}.gz 中,包含 > 100 个文件夹。如何设置流式传输作业并将它们全部用作输入?指定 s3n://bucket/ 没有帮助,因为节点是文件夹。

4

1 回答 1

0

Specify s3n://bucket/*/ as input and it should work fine.

于 2013-09-09T18:52:15.363 回答