mapreduce - Hadoop Map Reduce - Reducer 数量

Question

我有一个包含不同年龄段公司员工数据的用例。我需要找到三个年龄组类别的男性和女性员工的最高工资。

有关详细信息，请转到以下链接 -

我的问题是 - 这里我们只有两个由映射器发出的键，即男性和女性。我们在驱动程序类中设置了 3 个减速器，因此将创建 3 个分区。

可能有以下两件事-

score 0 · Accepted Answer

如果你想知道reducer的真实数量，你最好在集群上运行它。

正如在 map reduce 中的 reducer 数量中所说，它将启动 3 个 reducer，而 1 个 reducer 将不处理任何数据。如果您想使用所有三个 reducer，您可以更改 Partioner 类，例如按年龄组分区数据

1 回答 1