java - Hadoop JobClient.runJob：无法初始化集群 - 误导性错误消息（？）和建议的解决方案

Question

（我现在通过添加本文末尾指定的依赖项解决了这个问题，但想知道是否有更好的选择，或者我是否错过了一些重要的事情？）

尝试运行 mapreduce 作业时，该行

JobClient.runJob(conf)

给出以下错误堆栈：

Exception in thread "main" java.io.IOException: Cannot initialize Cluster. Please check your     configuration for mapreduce.framework.name and the correspond server addresses.
    at org.apache.hadoop.mapreduce.Cluster.initialize(Cluster.java:119)
    at org.apache.hadoop.mapreduce.Cluster.<init>(Cluster.java:81)
    at org.apache.hadoop.mapreduce.Cluster.<init>(Cluster.java:74)
    at org.apache.hadoop.mapred.JobClient.init(JobClient.java:465)
    at org.apache.hadoop.mapred.JobClient.<init>(JobClient.java:444)
    at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:826)

我的设置如下：

public static void main(String[] args) throws IOException {
    JobConf conf = new JobConf(Reduce.class);          
    conf.set("mapreduce.framework.name","yarn");
    conf.set("mapreduce.jobhistory.address","s17.myserver.com:10020");
    conf.set("mapreduce.jobhistory.webapp.address","s17.myserver.com:19888");

    conf.set("yarn.resourcemanager.address","s6.myserver.com:8032");
    conf.set("yarn.resourcemanager.scheduler.address","s6.myserver.com:8030");
    conf.set("yarn.resourcemanager.resource-tracker.address","s6.myserver.com:8031");
    conf.set("yarn.resourcemanager.admin.address","s6.myserver.com:8033");
    conf.set("yarn.resourcemanager.webapp.address","s6.myserver.com:8088");

    /// error on the following line
    JobClient.runJob(conf);
}

在花费大量时间尝试检查并重新检查我的配置后，我设法通过向我的项目添加以下依赖项来解决问题：

hadoop-mapreduce-client-jobclient

我在这里遗漏了什么还是错误信息只是一个特别具有误导性的信息？

score 0 · Accepted Answer

这种类型的配置应该由您的集群管理员完成，并作为 yarn-site 的一部分提供。每个作业都不需要添加它。话虽如此，错误消息并不是特别有用并且可以改进，但是对于 Hadoop 中的几乎所有错误消息都是如此......

java - Hadoop JobClient.runJob：无法初始化集群 - 误导性错误消息（？）和建议的解决方案

1 回答 1

Related

Reference