1

这听起来可能很基本,但我在 HDFS 中有一个包含 3 种文件的文件夹。例如:
access-02171990
s3.Log
catalina.out

我希望我的 map/reduce 只读取以 access-only 开头的文件。我如何通过程序做到这一点?或通过输入目录路径指定?请帮忙。

4

1 回答 1

3

您可以将输入路径设置为 glob:

FileInputFormat.addInputPath(jobConf, new Path("/your/path/access*"))
于 2013-09-19T18:26:30.767 回答