我想使用两个文件作为 MapReduce 程序的输入。但使用 * 不能用作文件名模式。
user2391084
问问题
1532 次
2 回答
1
我希望使用输入/应该可以解决问题。要开始尝试运行 Wordcount 示例: http: //www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/
在本教程的最后,他们向您解释了如何运行该作业(他们在驻留在输入映射中的多个字典文件上运行它)。
编辑:还要检查本教程以使用分布式文件系统,您通常需要 dfs 中的输入文件..
于 2013-08-05T07:34:37.573 回答
0
它可以工作,也应该可以在您的机器上工作。你确定你给的路径吗?是input/190*.txt还是/input/190*.txt。请注意“/”。假设没有 / 的路径存在于/user中,而带有 / 的路径直接存在于根目录下。
它也适用于 mv(或任何其他 HDFS 命令)。
于 2013-08-05T07:57:26.533 回答