1

我一直在尝试查找有关如何通过命令行提交 hadoop 作业的信息。

我知道命令 - hadoop jar jar-file main-class input output

还有另一个命令,我正在尝试查找信息,但无法 - hadoop job -submit job-file

什么是“工作文件”,如何创建?命令 (a.) 和 (b.) 之间的基本区别是什么?哪个是更好的选择?

提前致谢。

4

1 回答 1

1

这是运行 wordcount Map-reduce 作业的作业文件示例。同样,您可以为 Map-Reduce 作业编写作业文件。

mapred.input.dir=data/file1.txt
mapred.output.dir=output
mapred.job.name=wordcount
mapred.mapper.class=edu.uci.ics.hyracks.examples.wordcount.WordCount$Map
mapred.combiner.class=edu.uci.ics.hyracks.examples.wordcount.WordCount$Reduce
mapred.reducer.class=edu.uci.ics.hyracks.examples.wordcount.WordCount$Reduce
mapred.input.format.class=org.apache.hadoop.mapred.TextInputFormat
mapred.output.format.class=org.apache.hadoop.mapred.TextOutputFormat
mapred.mapoutput.key.class=org.apache.hadoop.io.Text
mapred.mapoutput.value.class=org.apache.hadoop.io.IntWritable
mapred.output.key.class=org.apache.hadoop.io.Text
mapred.output.value.class=org.apache.hadoop.io.IntWritable

对我来说,“Hadoop Jar”更好,因为在作业文件中完成的配置可以在程序本身中轻松完成。谢谢

于 2012-09-17T09:41:26.060 回答