我在 S3 中有这样的文件:
1-2013-08-22-22-something
2-2013-08-22-22-something
etc
没有 srcPattern 我可以轻松地从存储桶中获取所有文件,但我想获取特定的前缀,例如所有 1。我试过使用 srcPattern 但由于某种原因它没有拾取任何文件。
我当前的命令是:
elastic-mapreduce --jobflow $JOBFLOW --jar /home/hadoop/lib/emr-s3distcp-1.0.jar \
--args '--src,s3n://some-bucket/,--dest,hdfs:///hdfs-input,--srcPattern,[0-9]-.*' \
--step-name "copying over s3 files"