1

在为 Hadoop 搜索 python 客户端时,我发现了两个模块 pydoop 和 hadoopy。似乎两者都可以很好地使用,但不确定哪一个比另一个有更多的优势来安装一个。

4

1 回答 1

4

我认为最全面的文档是http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/

最近,我真的认为mrjob已经成为明显的领跑者。它有一个非常活跃的邮件列表,而且看起来相对稳定且最新。它还与 Amazon EMR 很好地集成。

于 2014-02-13T16:45:10.757 回答