我正在寻找提交 MapReduce 作业的最简单方法。
我正在寻找一个复杂性(或简单性)类似的平台,例如 Heroku(对于 Ruby)或 picloud.com 是要映射的。
这个想法是初学者可以提交 MapReduce 作业,而无需处理设置 Hadoop 集群的复杂性。Elastic Map Reduce 已接近尾声,但设置实例的启动时间令人大跌眼镜。
所以基本上我一直在寻找完成 picloud 等价于 MapReduce 的人。
谢谢。
我正在寻找提交 MapReduce 作业的最简单方法。
我正在寻找一个复杂性(或简单性)类似的平台,例如 Heroku(对于 Ruby)或 picloud.com 是要映射的。
这个想法是初学者可以提交 MapReduce 作业,而无需处理设置 Hadoop 集群的复杂性。Elastic Map Reduce 已接近尾声,但设置实例的启动时间令人大跌眼镜。
所以基本上我一直在寻找完成 picloud 等价于 MapReduce 的人。
谢谢。
两个不错的入门资源:
使用 Amazon Elastic Mapreduce:http ://aws.amazon.com/aws-training/elasticmapreduce/
使用 Cloudera CDH 解决方案(更多涉及并依赖 Hive 而不是实际的 MapReduce 作业): http: //www.infoq.com/articles/BigDataBlueprint
编辑:如果您不喜欢 Elastic MapReduce,您可能想尝试一下 Sears MetaScale(我还没有尝试过):http ://www.metascale.com/services/big-data