我有一个场景,我们必须定期将 HFiles 加载到 HBase 表中。
每次运行的 HFile 大小可以在每个区域 50 到 150 MB 之间。这些负载可能是每天 12 次,在某些情况下可能是每 15 分钟一次。
在进行测试时,我观察到即使在区域中立即拥有超过 3 个文件后,Minor 压缩也不会被触发。这可能会导致问题有很多文件持有相同行键的行。
我已经看到在 10000 秒(大约 2 小时 45 分钟)后唤醒的压缩线程正在开始压缩并将压缩任务放入队列中。
是否有任何配置可以告诉在批量加载(completebulkload)写入 3 个或更多 hFile 时触发次要压缩,而不管 HFile 的大小?
Hbase 版本:HBase 1.1.2.2.6.5.4-1
Configuration:
hbase.hstore.compaction.max = 10
hbase.hstore.compactionThreshold = 3
hbase.server.thread.wakefrequency = 10000