hadoop - Hector 的批量突变与使用 Hadoop 作业将数据加载到 Cassandra 中？

Question

有人可以强调 Hector 的批量突变和使用 Hadoop 作业将数据加载到 Cassandra 的优缺点吗？

我知道在赫克托您可以执行以下操作：

mutator.addInsertion(...);
mutator.execute();

在 Hadoop 中，您可以使用 MR 作业将数据加载到 Cassandra。

我正在寻找使用或不使用它们的原因。谢谢！

score 2 · Accepted Answer

如果数据源当前不在 hadoop（或 hbase）中，我建议只使用如上所述的 Mutator 的多线程加载程序来减少移动部件的数量。

此要点已过时，但方法类似： https ://gist.github.com/397574

如果您想了解更多详情，请告诉我。

1 回答 1