我最近遇到了一个案例,Cassandra 非常适合存储基于时间的事件,每个事件类型都有自定义 ttls(另一种解决方案是将它保存在 hadoop 中并手动进行簿记(ttls 和东西,恕我直言,这是一个非常复杂的想法)或切换到 hbase)。问题是 cassandra MapReduce 支持在没有 Datastax 企业版的情况下开箱即用的效果如何。
似乎他们在 CassandraFS 上投入了很多,但我问自己,普通的 Pig CassandraLoader 是否得到积极维护并且实际上可以扩展(因为它似乎只是在切片中迭代行)。这适用于数以百万计的行吗?