0

I have choice of using Hbase or cassandra. I will be writing map-reduce tasks to process data. So which will be better choice Hbase or cassandra. And which will be better to use with hive and pig?

4

2 回答 2

1

我都用过。我不确定@Tariq 在不重启集群的情况下修改是什么意思,因为我在修改 cassandra 模式时不会重启集群。我没有使用过 Pig 和 Hive,但据我了解,那些只是坐在 map/reduce 上,我使用了 map/reduce cassandra 适配器,效果很好。我们也知道有些人也使用过带有 map/reduce 的 PlayOrm,而 PlayOrm 目前还没有编写 hbase 提供程序。他们现在有 cassandra 和 mongodb,因此您可以编写一个客户端,它可以在任一数据库上运行。当然,对于每个 nosql store 的具体功能,您可以获取驱动程序并直接与 nosql store 对话,而不是通过 playOrm,但是 nosql store 之间的许多功能非常相似。

于 2013-04-30T11:40:49.440 回答
0

我建议使用 HBase,因为它具有原生 MR 支持,并且可以无缝地运行在您现有的 Hadoop 集群之上。此外,无需重启集群即可修改的更简单的模式是一大优势。它还提供与 Pig 和 Hive 的轻松集成。

于 2013-04-29T23:17:00.880 回答