我在我的 hbase 集群中使用了 5 个 regionserve。我只是将 url 的 md5 哈希存储为行键,并且只有一个包含数据字段的列族包含与键对应的数据(每行包含大小约为 30 KB 的数据)。我的请求是读取密集型的(写入很少,读取很大)。我已经使用 5 的预拆分(在 5 个区域服务器上统一存储数据)为我的集群完成了大约 300000 个条目的基准标记,并且我得到了大约 200 的 qps。在基准测试中,我运行了 150 个线程来查询从单独的客户端框中读取的内容。
这个qps对我来说太少了。可以做哪些优化来提高读qps(如果写qps会因为优化而降低,对我来说没关系)。截至目前,我正在使用 hbase 的默认配置。包括 master 在内的每个 regionserver 都有 8 GB RAM 和 4 个内核。我的集群位于同一区域的 AWS 中。