0

我想在 oozie 工作流中为现有的 mapreduce jar(带有映射器、reducer 和有时还包括组合器)文件配置一个 mapreduce 操作,这样只有 reducer/combiner 在输入文件上运行。

4

1 回答 1

0

所有 MapReduce 作业都必须运行映射阶段,但是您可以让映射器通过以下任一方式直接传递数据:

  • 在旧的 MR API 中使用IdentityMapper
  • 在新的 MR API 中,根本不指定映射器类,这将默认为Mapper充当身份映射器的基类
于 2015-02-16T21:57:07.013 回答