众所周知,在 map 任务中接收单词并在 WordCount 示例中的 reduce 任务中总结那些“一个”。
我尝试添加 System.out.println 以显示 wordcount 示例代码如何在 map/reduce 任务中运行。当我在 jobtracker 的网页上阅读 stdout 日志时,我注意到在 map 任务完成之前执行了一些“总结”工作,并在 reduce 任务中重新“总结”了 map 任务中的这些总和。
即使它不影响字数示例中的结果,但在其他工作中可能会出现问题。(做两次相同的工作!)
我已经修改了“mapred.reduce.slowstart.completed.maps”,但它不起作用。
有没有关于这个问题的配置?