load-balancing - HBase 和缩放读取

Question

我有一个复制因子为 3 的 HBase 集群。我正在尝试提高读取性能，以便每秒获得更多的“获取”。

当我标记 Gets（读取）时，我使用 htable 池建立了到 HBase 的连接并连接到表。然后我以更快的间隔反复读取同一行并监控集群负载。集群中的所有节点都具有相同的硬件。我注意到的是单个节点上的 CPU 负载在启动时。鉴于我已将集群配置为复制因子为 3，我会假设读取将在任何数据副本上执行，而不是在单个节点上的单个副本上执行（我希望看到负载增加 3服务器，而不仅仅是一个）。

如何提高读取性能，以便我的 Get 查询在 3 个复制的数据集之间更好地平衡，而不是从单个节点读取。

谢谢

score 1 · Accepted Answer

复制因子 3 意味着底层 HDFS 块被复制 3 次，但每个 HBase 区域都由单个 HRegionServer 提供服务，因此只能从一个位置提供一行。

load-balancing - HBase 和缩放读取

1 回答 1

Related

Reference