0

我的 hadoop 程序使用一个映射器,它将输入数据分成一定数量的部分,这些部分在/usr/countcomputers.txt文件中设置(由映射器函数读取)。进一步在一个部分到达每个减速器。因此,在/usr/countcomputers.txt文件中设置的数字定义了减速器的数量。在这方面我有一个问题:reducers 仅在启动 TaskTracker 的恶魔的计算机上执行,或者在所有节点上执行,包括由 JobTracker 和 Secondary NameNode 启动的 NameNode 的哪些恶魔?对我来说,知道对这个问题的回答非常重要,因为/usr/countcomputers.txt文件中设置的数字取决于它,在程序中读取。

4

1 回答 1

0

只允许 tasktracker 运行 reducer(如果您为 property 配置了一个大于零的数字mapreduce.tasktracker.reduce.tasks.maximum)。

因此,您可以放心地假设只有在运行 tasktracker 的主机上,才会执行 reduce 任务。

于 2013-02-06T17:27:32.373 回答