我计划设计一个需要扩展到大量数据的系统。在其操作开始时,它将使用预算有限的小型数据集,因此它也必须在小型数据集上运行良好。
据我所知,HBase 在小型数据集上效果不佳,它至少需要一个 5 节点集群。但目前这种配置很昂贵。我知道 HBase 和 Cassandra 对于大型数据集都是很好的解决方案。但是 Cassandra 在具有小数据集的单个节点上更快吗?
我假设 Cassandra 在小型数据集上没有问题,因为所有节点都是基于 P2P 系统的相同的。这个对吗?
Cassandra 和 hbase 具有不同的性能特征,虽然它们都擅长一些问题,但您可能应该选择最适合您的应用程序的数据库,而不是数据库对小型数据集的性能。
不太了解您的问题,我可能会从一个简单的 sql 数据库开始,并在需要时担心扩展。
您可以在单个节点上运行 cassandra,它会正常工作。
我怀疑您可以在单个物理机器上使用多个 vm 运行 hbase。
您也可以使用单节点 Hbase。无论如何请记住,单节点 Hbase/Cassandra 在性能上无法与多个节点相媲美,因为您没有复制。