我用java写了一个mapreduce作业。输入文件的大小为 2GB。当我在一个 8 节点集群上运行我的代码时,我得到了 16 个slip,我可以从日志中看到它们在不同的节点上运行。但是,reducer 任务仅在“ONE 节点”上运行。我得到没有任何错误的输出。我检查了我的配置一切似乎都很好。
我试过了
job.setNumReduceTasks(100);
-D mapreduce.job.reduces=100
我也得到 100 个输出文件。映射器任务分布在节点之间,但不是减少任务。
我正在使用 cloudera 服务。