我有三个减速器,我需要它们每个都接收相同的密钥,如下所示:
GOOG - Reducer 0
AAPL - Reducer 1
VMW - Reducer 2
在分区器中,getPartition() 方法应返回一个 int,指示缩减器的索引(0,1,2)之一。
我拥有的 getPartition() 的实现是:
return ((CompositeKey) key).getSymbol().hashCode() % numReduceTasks;
然而,这在这里不起作用是我得到的:
int numReduceTasks = 3;
System.out.println("GOOG".hashCode() % numReduceTasks);//output: 0
System.out.println("AAPL".hashCode() % numReduceTasks);//output: 1
System.out.println("VMW".hashCode() % numReduceTasks);//output: 1
所以在我得到的输出文件中
.../part-r-00000
GOOG
.../part-r-00001
AAPL
VMW
.../part-r-00002
<empty>
问题是我该如何解决这个问题?即我如何编写一个分区函数来保证相同的键进入同一个reducer。