我希望 Map 的输出是SequenceFileOutputFormat,而 reduce 的最终输出是TextOutputFormat。
作业配置只允许指定setOutputFormatClass
如何为 map 和 reduce 阶段设置不同的输出格式?
我不相信您可以为映射器和化简器指定不同的输出格式,只是为了整体工作。您可以尝试一个选项,具体取决于您的处理,您可以让一个作业以 SequenceFileOutputFormat 输出文件,然后另一个作业读取并处理它以将其转换为 TextOutputFormat。
Job 配置还允许使用hadoop mapreduce 包中Job 类的setMapOutputKeyClass 和 setMapOutputValueClass 方法指定 Map 的输出