具体来说,我想更改在 Microsoft Azure 上运行的 HDInsight 群集中每个节点的最大映射器数量和最大减速器数量。
使用远程桌面,我登录到头节点。我编辑了头节点上的 mapred-site.xml 文件并更改了 mapred.tasktracker.map.tasks.maximum 和 mapred.tasktracker.reduce.tasks.maximum 值。我尝试重新启动头节点,但无法重新启动。我使用 start-onebox.cmd 和 stop-onebox.cmd 脚本来尝试启动/停止 HDInsight。
然后我运行了一个流式mapreduce,将所需数量的reducer 传递给hadoop-streaming.jar,但是reducer 的数量仍然受到之前mapred.tasktracker.reduce.tasks.maximum 值的限制。我的大多数减速器都在等待执行。
我是否需要更改每个节点上的 mapred-site.xml 文件?有没有一种简单的方法来改变这个,或者我需要远程桌面到每个节点?如何重新启动或重新启动集群以便使用我的新值?
谢谢