0

我需要存储数百万条记录,其中所有记录都是唯一的,具有多列。例如

eventcode description count
526       blocked     100
5230       xxx         20
....

并且我在获取计数列上的排序、列上的过滤时需要以下要求。

所以我想到了使用 Hbase,但我用谷歌搜索并知道超表更快。

所以我有点困惑知道它。请帮助我解决这个问题。

注意:我想将 C++ 用于事务(读取、写入)。

4

1 回答 1

2

大免责声明:我为 hypertable 工作。

我们前段时间创建了一个基准测试,您可以在此处阅读:http ://hypertable.com//why_hypertable/hypertable_vs_hbase_2/ 结论:Hypertable 速度更快,通常快两倍。

性能实际上是hypertable成立的原因。那时有些人坐在一起讨论 Google 的 bigtable 架构的开源实现。他们没有就编程语言达成一致(java vs. c++ - 分歧在于性能)。结果,一组创建了 hypertable(一种 C++ 实现),另一组开始研究 hbase(在 java 中)。

如果您不信任基准,那么您将不得不运行自己的基准;这两个系统都是开源的并且可以免费使用。如果您对超表有疑问或在评估时遇到问题,请随时给我发邮件(或使用邮件列表 - 所有问题都会得到解答。)

顺便说一句 - 超表不(还)支持排序。您必须在您的客户端应用程序中实现它。

于 2012-07-20T18:25:41.120 回答