我想在 oozie 工作流中为现有的 mapreduce jar(带有映射器、reducer 和有时还包括组合器)文件配置一个 mapreduce 操作,这样只有 reducer/combiner 在输入文件上运行。
问问题
188 次
1 回答
0
所有 MapReduce 作业都必须运行映射阶段,但是您可以让映射器通过以下任一方式直接传递数据:
- 在旧的 MR API 中使用
IdentityMapper
- 在新的 MR API 中,根本不指定映射器类,这将默认为
Mapper
充当身份映射器的基类
于 2015-02-16T21:57:07.013 回答