1

有人可以向我指出任何可以帮助我在 EC2 上手动设置/配置 Hadoop (1.0.4) 的资源的方向。我同意有很多资源可以使用工具、服务等来完成这项工作,但我正在寻找的是一些帮助,以确定手动对从属和主控的 conf/*.xml 文件进行哪些修改,以便让 Hadoop 工作。

现在,我有 5 个 ec2 实例正在运行,它们都能够在伪分布式模式下单独运行 hadoop 作业。所以,我需要通过配置conf文件的方式把一个变成master,剩下的变成slave,这样slave就知道namenode和jobtracker在哪里,master知道所有的slave。

我的理解是,我还必须配置实例的 EC2 安全组,以便它们都可以在正确的端口上相互通信。我想我可以接受。

任何人都可以帮助我完成配置部分,或者指出一些可能有帮助的东西吗?

4

1 回答 1

1

我在这里找到了这个详尽的教程,它最终让我启动并运行:http: //cloudblog.8kmiles.com/2011/12/05/hadoop-fully-distributed-setup/

于 2013-04-10T21:51:41.627 回答