1

我正在关注Hadoop in Action以开始使用 ec2 的 hadoop。我在 ubuntu 上运行并且已经下载并安装了最新版本的 Hadoop。我在这个命令上遇到了障碍:

hadoop-ec2 launch-cluster mycluster 2

这本书说“Hadoop EC2 工具位于 Hadoop 安装下的目录 src/contrib/ec2/bin 中。回想一下,我们的 ec2-init.sh 脚本已经将该目录添加到您的系统 PATH。在该目录中是 hadoop-ec2 , 这是用于执行其他命令的元命令。要在 ec2 上启动 Hadoop 集群,请使用:

hadoop-ec2 启动集群 <集群名称> <从属设备数量> "


我得到的回应是:hadoop-ec2: command not found

我注意到变量$HADOOP_HOME没有设置。

看来这本书已经过时了。

  1. 有人可以指导我阅读过去几个月创建的关于如何使用 ec2 设置 hadoop 的教程吗?
  2. 经过一些快速的谷歌搜索后,它似乎已HADOOP_HOME被弃用。这是真的?
  3. 我能够毫无问题地执行ec2-describe-images。并获取我可以使用的所有可用图像。为什么hadoop-ec2命令不起作用?

感谢您的指导。

4

1 回答 1

1

不幸的是,在 Amazon EC2 上运行 Hadoop的专用页面(HADOOP_HOME确实不方便)本身已经过时了,并且似乎不再适用于最新的稳定版本(当时是 1.0.4写作)。我不知道更新的“本机”教程,但显然用户对通过Apache Whirr的方法非常满意(顺便说一句,该方法始于 2007 年,作为Apache Hadoop中的一些 bash 脚本,用于在 EC2 上运行 Hadoop 集群)。

因此,有一个Whirr™ 入门</a> 可用,此外还有相关的 3rd 方教程,例如:

我希望你能够将书中关于使用Apache Hadoop的信息与关于通过 Apache Whirr 运行 Hadoop 集群的信息合并起来——祝你好运!

于 2013-04-29T18:29:07.647 回答