我是 Hadoop 新手。我在 eclipse 中有一个简单的 wordcount 程序,它接受输入文件,然后显示输出。但我需要从HDFS执行相同的程序。我已经为 wordcount 程序创建了一个 JAR 文件。任何人都可以让我知道如何进行吗?
问问题
1881 次
2 回答
2
您需要设置集群,即使是单节点集群。然后您可以从 hadoop 命令行运行您的 .jar:
运行一个 jar 文件。用户可以将他们的 Map Reduce 代码捆绑在一个 jar 文件中并使用此命令执行它。
Usage: hadoop jar <jar> [mainClass] args...
流作业通过此命令运行。例子可以参考Streaming examples
字数统计示例也使用 jar 命令运行。可以参考Wordcount 例子
于 2013-07-08T06:42:12.710 回答