Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
当我们将多个 reducer 设置为 one 时会发生什么?它是写入单个文件还是造成瓶颈(因为默认情况下reducer 的数量是一个)。减速器的数量是否由运行时决定?
当使用 1 个 reducer 运行作业时,您会失去 reducer 任务的并行性。reducer 任务将接收所有映射器的输出,并且可能会占用大量内存,并且最终会写入单个文件。reducer 的数量默认为 1,但可以并且应该通过在作业配置中设置来增加
jobConf.set("mapred.reduce.tasks", numReducers)