我有 2 个节点的 Hadoop 0.2.2 集群。在我启动的第一台机器上:
- 名称节点
- 数据节点
- 节点管理器
- 资源管理器
- 作业历史服务器
在第二个我开始所有这些,除了namenode:
- 数据节点
- 节点管理器
- 资源管理器
- 作业历史服务器
我mapred-site.xml
在两台机器上都包含:
<property>
<name>mapred.job.tracker</name>
<value>firstMachine:54311</value>
</property>
我在两台机器上的 core-site.xml 包含:
<property>
<name>fs.default.name</name>
<value>hdfs://firstMachine:9000</value>
</property>
控制台http://firstMachine:50070
报告 2 个节点:
Live Nodes : 2 (Decommissioned: 0)
但是控制台http://firstMachine:8088
(带有地图减少工作历史和所有这些的控制台)一直在说:
Active Nodes: 1
此外,在有或没有第二台机器的情况下执行 map reduce,Hadoop 产生几乎相同的性能。使用 wordcout 示例进行了尝试,使用了 4 个大文件。
我的问题是:如何检查我的 map reduce 是否实际上在多台(在这种情况下为 2 台)机器上执行,而不仅仅是启动它的那台机器?
如果我的 Hadoop map reduce 实际上没有看到其他 Hadoop 实例,我如何让它看到它(如何配置它以在 2 台机器上运行 map reduce)?