有人可以强调 Hector 的批量突变和使用 Hadoop 作业将数据加载到 Cassandra 的优缺点吗?
我知道在赫克托您可以执行以下操作:
mutator.addInsertion(...);
mutator.execute();
在 Hadoop 中,您可以使用 MR 作业将数据加载到 Cassandra。
我正在寻找使用或不使用它们的原因。谢谢!
如果数据源当前不在 hadoop(或 hbase)中,我建议只使用如上所述的 Mutator 的多线程加载程序来减少移动部件的数量。
此要点已过时,但方法类似: https ://gist.github.com/397574
如果您想了解更多详情,请告诉我。