mapreduce - 如何将多个文件作为输入传递给 MapReduce？

Question

我想使用两个文件作为 MapReduce 程序的输入。但使用 * 不能用作文件名模式。

score 1 · Accepted Answer

我希望使用输入/应该可以解决问题。要开始尝试运行 Wordcount 示例： http: //www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

在本教程的最后，他们向您解释了如何运行该作业（他们在驻留在输入映射中的多个字典文件上运行它）。

编辑：还要检查本教程以使用分布式文件系统，您通常需要 dfs 中的输入文件..

score 0 · Accepted Answer

它可以工作，也应该可以在您的机器上工作。你确定你给的路径吗？是input/190*.txt还是/input/190*.txt。请注意“/”。假设没有 / 的路径存在于/user中，而带有 / 的路径直接存在于根目录下。

它也适用于 mv（或任何其他 HDFS 命令）。

2 回答 2