我正在使用 Yarn 运行 MR java 程序,即使映射器的数量是 24 ,但实际运行的映射器是 10 ,其余 14 个映射处于挂起状态。如何使它们也进入运行模式。我们正在运行 MAPR 6 节点集群。更改了 mapred-site.xml 和 Yarn-site.xml 中的以下属性。这些值被默认值覆盖,但我仍然没有看到任何性能基准。
笔记 。我正在运行具有 MRv1 性能的相同程序,它更好一些。所以请建议我如何很好地利用集群利用率资源。
使用的命令: yarn jar /opt/cluster/bin/logmessage-1.0-SNAPSHOT.jar com.message.WordPreprocessDriver -Dmapreduce.input.fileinputformat.split.maxsize=33554432 /data/123.txt
在纱线站点
<name>yarn.nodemanager.resource.memory-mb</name>
<value>20960</value>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>2048</value>
在mapred-site
<name>mapreduce.map.memory.mb</name>
<value>4096</value>
<name>mapreduce.reduce.memory.mb</name>
<value>8192</value>
<name>mapreduce.map.java.opts</name>
<value>-Xmx3072m</value>
<name>mapreduce.reduce.java.opts</name>
<value>-Xmx6144m</value>
mapreduce.job.maps
<name> mapreduce.job.maps</name>
<value>4</value>
您会看到实际上容器总数为 11 。有 40 个 vcore 可用,其中 11 个 vcore 在运行 MR 程序时使用。你能分享一下需要改变哪些属性吗?
谢谢你,马杜