我是一名学生,对 Hadoop 很感兴趣,最近开始探索它。我尝试在该模式下添加一个额外的 DataNodepseudo-distributed
但失败了。
我正在关注 Yahoo 开发人员教程,所以我使用的 Hadoop 版本是hadoop-0.18.0
我尝试使用我在网上找到的 2 种方法启动:
方法一(链接)
我对这条线有疑问
bin/hadoop-daemon.sh --script bin/hdfs $1 datanode $DN_CONF_OPTS
--script bin/hdfs
在我使用的版本中似乎无效。我将其更改为 --config$HADOOP_HOME/conf2
以及该目录中的所有配置文件,但是当脚本运行时它给出了错误:
用法:Java DataNode [-rollback]
知道错误是什么意思吗?日志文件已创建,但 DataNode 未启动。
方法二(链接)
基本上,我将 conf 文件夹复制到conf2
文件夹,对网站上记录的必要更改hadoop-site.xml
和hadoop-env.sh
. 然后我运行了命令
./hadoop-daemon.sh --config ..../conf2 start datanode
它给出了错误:
作为进程 4190 运行的数据节点。首先停止它。
所以我猜这是启动的第一个 DataNode,并且该命令无法启动另一个 DataNode。
我可以做些什么来在 Yahoo VM Hadoop 环境中启动额外的 DataNode 吗?任何帮助/建议将不胜感激。