嗨,我想学习如何在 hadoop 中按值对字数进行排序。我知道 hadoop 采用排序键,但不是按值。
我知道要对值进行排序,我们必须有一个分区器、分组比较器和一个排序比较器
但是我在将这些概念一起应用以按值对字数进行排序时有点困惑。
我们是否需要另一个 map reduce 作业来实现相同的目的,或者需要一个组合器来计算出现次数,然后在这里排序并将相同的结果发送到 reducer?
谁能解释如何按值对字数示例进行排序?
嗨,我想学习如何在 hadoop 中按值对字数进行排序。我知道 hadoop 采用排序键,但不是按值。
我知道要对值进行排序,我们必须有一个分区器、分组比较器和一个排序比较器
但是我在将这些概念一起应用以按值对字数进行排序时有点困惑。
我们是否需要另一个 map reduce 作业来实现相同的目的,或者需要一个组合器来计算出现次数,然后在这里排序并将相同的结果发送到 reducer?
谁能解释如何按值对字数示例进行排序?