3

我想使用匹配某些模式的行从 HBase shell 扫描 HTable 中的行。

例如,我有下表数据:

    row:r1_t1  column:cf:a, timestamp=1461911995948,value=v1
    row:r2_t2  column:cf:a, timestamp=1461911995949,value=v2
    row:s1_t1  column:cf:a, timestamp=1461911995950,value=q1
    row:s2_t2  column:cf:a, timestamp=1461911995951,value=q2

根据上述数据,我想找到包含 't1' 的行:

    row:r1_t1  column:cf:a, timestamp=1461911995948,value=v1
    row:s1_t1  column:cf:a, timestamp=1461911995950,value=q1

我知道我可以使用 PrefixFilter 扫描表,但此方法采用以指定过滤器开头的行。

    scan 'test', {FILTER => "(PrefixFilter('s')"}

是否有类似的基于过滤行名中间模式匹配的行来扫描表的方法?

4

1 回答 1

5
hbase(main):003:0> scan 'test', {ENDROW => 't1'}

通常,使用 aPrefixFilter可能会很慢,因为它会执行表扫描,直到到达前缀。

也可以将 RowFilter 与 SubstringComparator 一起使用,如下所示

可以像下面这样RowFilter使用SubstringComparator

hbase(main):003:0> import org.apache.hadoop.hbase.filter.CompareFilter
hbase(main):005:0> import org.apache.hadoop.hbase.filter.SubstringComparator
hbase(main):006:0> scan 'test', {FILTER => org.apache.hadoop.hbase.filter.RowFilter.new(CompareFilter::CompareOp.valueOf('EQUAL'),SubstringComparator.new("searchkeyword"))}
于 2016-04-29T11:09:45.403 回答