头疼了好久,目前我的hadoop集群是这样的,我有40个salve节点要运行,每个slave节点我配置25个mapper 10个reducer,所以大概可以启动40*25=1000个mapper和400个reducer同时。好的,现在我有以下工作:</p>
job1:我配置运行 5 个映射器和 5 个减速器 job2:我配置运行 20 个映射器和 10 个减速器 job3:我配置运行 975 个映射器和 385 个减速器
假设我使用默认的 FIFO 作业调度,如果我连续提交 3 个映射器,这 3 个作业是否可以同时运行?以便最大限度地利用集群?
目前,我测试在mapper阶段,提交3个作业后似乎可以启动1000个mapper,但是在reducer阶段,它变得非常非常慢,所以我等待了很长时间,以上作业都没有完成,似乎他们挂在减速器阶段。
我不是很明白这其中的内在原因,谁能帮我解决这个问题,以便我可以提交工作并睡觉,然后明天早上我看到我所有的工作都按订单完成了?我需要使用公平的调度来使它工作吗????