Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我已经链接了 2 个映射器,然后是 1 个减速器。是否可以将中间输出(链中每个映射器的 o/p)写入 HDFS?我尝试为每个设置 OutputPath,但它似乎不起作用。现在,我不确定它是否可以完成。有什么建议么?
结果总是作为 SequenceFile 写入 HDFS。但是,如果您使用的是减速器,这些家伙只是临时文件,它们会在作业完成后被删除。如果您需要地图输出,则必须链接两个作业。一个没有减速器的工作,一个有减速器的工作。或者,如果您在从地图任务中写入 hdfs 文件方面有一点技巧,这也是可能的。 第一种方法是非编码的,但第二种方法是。由你决定!