我是 Hadoop 新手,在 AWS Elastic Mapreduce 下运行。
我需要 Hadoop 中的集群范围的原子计数器,并建议为此使用 zookeeper。
我相信 zookeeper 是 Hadoop 堆栈的一部分(对吗?),我如何从 Elastic Mapreduce 作业访问它以设置和更新集群范围的计数器?
我是 Hadoop 新手,在 AWS Elastic Mapreduce 下运行。
我需要 Hadoop 中的集群范围的原子计数器,并建议为此使用 zookeeper。
我相信 zookeeper 是 Hadoop 堆栈的一部分(对吗?),我如何从 Elastic Mapreduce 作业访问它以设置和更新集群范围的计数器?
你可以,正如 Praveen Sripati 回答的那样。但我不想澄清一些观点:
我建议使用专用的序列生成器服务器,它会为你生成序列(并且该服务可以使用 Zk 或任何它想要的)。此类服务的一个示例:https ://github.com/kasabi/H1