有人可以解释 MapReduce 如何与 Cassandra .6 一起工作吗?我已经阅读了字数统计示例,但我不太了解 Cassandra 端与“客户端”端发生的情况。
https://svn.apache.org/repos/asf/cassandra/trunk/contrib/word_count/
例如,假设我正在使用 Python 和 Pycassa,我将如何加载一个新的 map reduce 函数,然后调用它?我的 map reduce 功能必须是安装在 cassandra 服务器上的 java 吗?如果是这样,我如何从 Pycassa 调用它?
还有人提到 Pig 让这一切变得更容易,但我是一个完整的 Hadoop 菜鸟,所以这并没有真正帮助。
您的答案可以使用 Thrift 或其他任何东西,我刚刚提到 Pycassa 来表示客户端。我只是想了解 Cassandra 集群中运行的内容与发出请求的实际服务器之间的区别。