4

由于 Cassandra 还没有内置 MapReduce(我认为它会在 0.7 中出现),尝试使用我的 Python 客户端使用 MapReduce 是愚蠢的,还是应该只使用 CouchDB 或 Mongo 之类的?

该应用程序是统计数据集合,因此我需要能够通过分组对值求和以增加计数器。我不是,但假装我在做谷歌分析,所以我想跟踪出现了哪些浏览器,他们去了哪些页面,以及访问量与综合浏览量。

我会在写入时自动更新我的计数器,但 Cassandra 也不擅长计数器。

卡桑德拉可能不是这个的正确选择吗?

谢谢!

4

2 回答 2

6

Cassandra 从 0.6 版开始支持 map reduce。(当前的稳定版本是 0.5.1,但请继续尝试 0.6.0-beta3 中的新 map reduce 功能)要开始使用,我建议查看 'contrib/word_count' 中的 word count map reduce 示例。

于 2010-03-27T08:54:33.337 回答
3

MongoDB 具有就地更新功能,因此 MongoDB 应该非常适合使用计数器。http://blog.mongodb.org/post/171353301/using-mongodb-for-real-time-analytics

于 2010-03-27T09:27:26.933 回答