我有一个复制因子为 3 的 HBase 集群。我正在尝试提高读取性能,以便每秒获得更多的“获取”。
当我标记 Gets(读取)时,我使用 htable 池建立了到 HBase 的连接并连接到表。然后我以更快的间隔反复读取同一行并监控集群负载。集群中的所有节点都具有相同的硬件。我注意到的是单个节点上的 CPU 负载在启动时。鉴于我已将集群配置为复制因子为 3,我会假设读取将在任何数据副本上执行,而不是在单个节点上的单个副本上执行(我希望看到负载增加 3服务器,而不仅仅是一个)。
如何提高读取性能,以便我的 Get 查询在 3 个复制的数据集之间更好地平衡,而不是从单个节点读取。
谢谢