2

我计划设计一个需要扩展到大量数据的系统。在其操作开始时,它将使用预算有限的小型数据集,因此它也必须在小型数据集上运行良好。

据我所知,HBase 在小型数据集上效果不佳,它至少需要一个 5 节点集群。但目前这种配置很昂贵。我知道 HBase 和 Cassandra 对于大型数据集都是很好的解决方案。但是 Cassandra 在具有小数据集的单个节点上更快吗?

我假设 Cassandra 在小型数据集上没有问题,因为所有节点都是基于 P2P 系统的相同的。这个对吗?

4

2 回答 2

3

Cassandra 和 hbase 具有不同的性能特征,虽然它们都擅长一些问题,但您可能应该选择最适合您的应用程序的数据库,而不是数据库对小型数据集的性能。

不太了解您的问题,我可能会从一个简单的 sql 数据库开始,并在需要时担心扩展。

您可以在单个节点上运行 cassandra,它会正常工作。

我怀疑您可以在单个物理机器上使用多个 vm 运行 hbase。

于 2012-05-01T02:31:22.977 回答
0

您也可以使用单节点 Hbase。无论如何请记住,单节点 Hbase/Cassandra 在性能上无法与多个节点相媲美,因为您没有复制。

于 2012-05-09T19:27:39.480 回答