1

我已经在 2 节点集群上安装了 CDH3U5。一切似乎都运行良好,例如所有服务、Web UI、MR 作业、HDFS shell 命令。然而,有趣的是,当我启动 datanode 服务时,它给了我一条 OK 消息,表明 datanode 正在作为进程运行,比如 X。但是当我运行 JPS 时,我没有看到进程的标签“Datanode”。所以输出看起来像 -

17153 TaskTracker
18908 Jps
16267

进程 ID - 16267 是 Datanode 进程。其他所有检查点均已通过。所以这看起来很奇怪。同样的事情发生在集群中的另一个节点上。对此行为的任何见解以及是否需要修复都会有所帮助。

4

1 回答 1

0
您可以检查以下内容并回复吗?
- namenode 的 Web 界面以及它在 livenode 上显示的内容
- 数据节点的日志文件以查看是否有任何异常
- 如果 datanode 可以从 namenode ping/ssh,反之亦然

如果以上所有内容都正常,我不确定问题是什么,但可以解决
- 停止所有 hadoop 守护进程
- 删除 conf/core-site.xml 中指向 NN 和 DN 的临时目录
- 格式化名称节点
- 启动守护进程
于 2013-04-16T02:34:12.813 回答