1

我希望 Map 的输出是SequenceFileOutputFormat,而 reduce 的最终输出是TextOutputFormat

作业配置只允许指定setOutputFormatClass

如何为 map 和 reduce 阶段设置不同的输出格式?

4

2 回答 2

1

我不相信您可以为映射器和化简器指定不同的输出格式,只是为了整体工作。您可以尝试一个选项,具体取决于您的处理,您可以让一个作业以 SequenceFileOutputFormat 输出文件,然后另一个作业读取并处理它以将其转换为 TextOutputFormat。

于 2013-09-20T03:15:03.183 回答
0

Job 配置还允许使用hadoop mapreduce 包中Job 类的setMapOutputKeyClass 和 setMapOutputValueClass 方法指定 Map 的输出

于 2013-09-17T03:18:01.577 回答