0

如何使用 mapreduce 为不同的输入文件在不同的文件中写入输出,例如假设我想从 video.txt 和 outlier.txt 计算每个文件的术语频率,将结果分别存储在 video1.txt 和 oulier1.txt 中?

4

1 回答 1

0

在您的映射器中,将文件名附加到您找到的每个单词。您的密钥将是“单词+文件名”。确保您的分区器使用“文件名”进行分区,以便同一文件中的所有单词都以相同的减速器结束

于 2013-04-14T17:49:26.847 回答