我正在使用 MRv2 运行多节点 hadoop 2.0.2 集群。我的问题是这个特定页面和 fsck 命令一次只显示 3 个活动节点:
尽管此页面显示实际没有。活节点
另一个问题是有时一些数据节点会自动关闭。我如何知道 pblm 以及为什么同一个集群显示两个不同的活动节点?
我正在使用 MRv2 运行多节点 hadoop 2.0.2 集群。我的问题是这个特定页面和 fsck 命令一次只显示 3 个活动节点:
尽管此页面显示实际没有。活节点
另一个问题是有时一些数据节点会自动关闭。我如何知道 pblm 以及为什么同一个集群显示两个不同的活动节点?
关于您使用的 Web 界面http://localhost:50070/dfshealth.jsp
适用于 NameNode WebUI 和http://localhost:8088/cluster
ResourceManager WebUI。
Although this page shows actual no. of live nodes
实际上它没有显示活动节点。如果您看到Last Health Updates
每个节点的Namenode 接口位于 50070。现在只有 3 个处于活动状态。
Another problem is some times some datanodes are getting shutdown automatically.
您的四个节点在 2013 年 3 月 15 日 01:00:00 左右出现故障(最后更新)。因此,我会调查您当时的数据节点日志文件,以了解它们关闭的原因。你可以在里面找到它们,$HADOOP_HOME/logs/
或者/var/log/hadoop*
,如果你没有设置HADOOP_LOG_DIR
环境变量
添加 应该在 yarn-site.xml 中进行一些配置,让 nodemanager 知道资源管理器在哪里。具体来说,我将此属性添加到 yarn-site.xml 中:
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
原因:yarn-default.xml中的默认值是0.0.0.0,很多属性使用这个hostname来联系资源管理器,比如
<property>
<name>yarn.resourcemanager.address</name>
<value>${yarn.resourcemanager.hostname}:8032</value>
</property>