1

我是 Hadoop 的新手。我正在尝试在我的 reducer 中编写一个自定义计数器。我找到了一个使用自定义计数器的示例,但它是在 hadoop 1.x 中。我没有为 hadoop 2.x 中的计数器找到任何合适的解决方案 谁能帮我解决这个问题..?提前致谢

4

1 回答 1

0

通过查看 2.x 的代码,我相信它的工作方式与早期版本的示例相同

计数器由 org.apache.hadoop.mapreduce.counters.AbstractCounters 维护

当请求缓存中尚未存在的计数器时,findCounter 会即时生成一个新计数器

  public synchronized C findCounter(Enum<?> key) {
    C counter = cache.get(key);
    if (counter == null) {
      counter = findCounter(key.getDeclaringClass().getName(), key.name());
      cache.put(key, counter);
    }
    return counter;
  }

(它使用枚举类名作为此枚举定义的计数器的组名)

传递给 map 和 reduce 方法的 org.apache.hadoop.mapreduce.Context 对象实现了 getCounter(Enum) 方法

于 2013-07-30T02:36:09.953 回答