我正在 Amazon EC2 m1.small 实例上测试 MapReduce wordcount 示例,我遵循了 Amazon 命令行入门指南。
bin/ec2hadoop 启动集群测试 2
使用这个命令我有 2 个从节点。(总共运行了 3 个实例)然后我可以登录到主节点运行 hadoop 程序(这是一个捆绑到 jar 文件中的程序)花了 35 分钟。
对于可扩展性实验,然后我使用 4 个实例运行相同的程序
bin/ec2hadoop 启动集群测试 4
令我惊讶的是,我没有看到任何性能提升。MapReduce 应用程序花费了几乎相同的时间(33 分钟)
问题出在哪里?这是可以接受的行为吗?
In mapred-site.xml
mapred.tasktracker.map.tasks.maximum is set to 1
mapred.tasktracker.reduce.tasks.maximum is set to 1
欢迎任何建议。