我有几个 HBase 表。它们的键控方式都不同,但每个键都有 32 位整数所有者 ID 作为键的一部分。每个表的偏移量不同,但我确实知道这些偏移量。现在,我传入了一个 ID 集合,我需要将与传入的所有者有关的数据转储到文件中。即我需要做一些与下面的 SQL 语句等效的事情:
SELECT * FROM table WHERE substr(key_field, offset, length) IN (...);
试图实现这一点,我写了这样的东西:
public class SubKeyComparator extends BinaryComparator {
private Set<Integer> idSet;
private int idLength = 4;
private int idOffset = 0;
// getters/setters are here
@Override
public int compareTo(byte[] value) {
return idSet.contains(Bytes.toInt(value, offset, length))? 0 : 1;
}
}
它似乎没有按预期工作。它实际上根本不起作用。我正在打开一张桌子,当我试图得到
ResultScanner scanner = htable.getScanner(scan);
它稍等片刻,然后抛出一个 org.apache.hadoop.hbase.client.RetriesExhaustedException,在 org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.getRegionServerWithRetries(HConnectionManager.java:1231 )
尝试在 Web 上找到解决方案或通过 HBase 源代码了解出了什么问题并没有产生任何显着的结果。如果我不将过滤器插入扫描对象,一切正常。
如果有人知道出了什么问题或做过类似的事情,我们将非常感谢您的帮助。