我一直在尝试使用以下命令在集群上启动 MapReduce 作业:
bin/hadoop jar myjar.jar MainClass /user/hduser/input /user/hduser/output
但是我一遍又一遍地收到以下错误,直到连接被拒绝:
13/08/08 00:37:16 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:54310. Already tried 5 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
然后我检查了 netstat 以查看服务是否正在侦听正确的端口:
~> sudo netstat -plten | grep java
tcp 0 0 10.1.1.4:54310 0.0.0.0:* LISTEN 10022 38365 11366/java
tcp 0 0 10.1.1.4:54311 0.0.0.0:* LISTEN 10022 32164 11829/java
现在我注意到我的服务正在监听端口 10.1.1.4:54310,这是我的主人的 IP,但似乎“hadoop jar”命令正在连接到 127.0.0.1(本地主机,这是同一台机器)但因此找不到该服务。无论如何强制“hadoop jar”查看 10.1.1.4 而不是 127.0.0.1?
我的 NameNode、DataNode、JobTracker、TaskTracker……都在运行。我什至检查了从站上的 DataNode 和 TaskTracker,这一切似乎都在工作。我可以检查主服务器上的 WebUI,它显示我的集群在线。
我预计问题与 DNS 相关,因为“hadoop jar”命令似乎找到了正确的端口,但始终使用 127.0.0.1 地址而不是 10.1.1.4
更新
core-site.xml中的配置
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/app/hadoop/tmp</value>
<description>A base for other temporary directories.</description>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://master:54310</value>
<description>The name of the default file system. A URI whose
scheme and authority determine the FileSystem implementation. The
uri's scheme determines the config property (fs.SCHEME.impl) naming
the FileSystem implementation class. The uri's authority is used to
determine the host, port, etc. for a filesystem.</description>
</property>
</configuration>
mapred-site.xml中的配置
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>master:54311</value>
<description>The host and port that the MapReduce job tracker runs
at. If "local", then jobs are run in-process as a single map
and reduce task.
</description>
</property>
</configuration>
hdfs-site.xml中的配置
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
<description>Default block replication.
The actual number of replications can be specified when the file is created.
The default is used if replication is not specified in create time.
</description>
</property>
</configuration>