38

我无法弄清楚如何在 HBase REST 接口 (HBase 0.90.4-cdh3u3) 中使用过滤器。该文档只是为我提供了“字符串”的模式定义,但没有显示如何使用它。

所以,我能够做到这一点:

curl -v -H 'Content-Type: text/xml' -d '<Scanner startRow="ddo" stopRow="ddp" batch="1024"/>' 'http://hbasegw:8080/table/scanner'

然后检索

curl -s -H "Content-Type: text/xml" http://hbasegw:8080/table/scanner/13293426893883128482b | tidy -i -q -xml

但现在我想使用 SingleColumnValueFilter 并且必须以某种方式在 XML 中对其进行编码。有没有人有这方面的例子?

谢谢,马里奥

4

1 回答 1

13

Scanner XML 中的过滤器字段是格式为 JSON 的字符串。由于过滤器的 JSON 中有很多引号,我建议为 curl 的 -d 参数使用单独的文件,以避免使用单引号。

curl -v -H "Content-Type:text/xml" -d @args.txt http://hbasegw:8080/table/scanner

文件在哪里args.txt

<Scanner startRow="cm93MDE=" endRow="cm93MDg=" batch="1024">
    <filter>
    {
        "latestVersion":true, "ifMissing":true, 
        "qualifier":"Y29sMQ==", "family":"ZmFtaWx5", 
        "op":"EQUAL", "type":"SingleColumnValueFilter", 
        "comparator":{"value":"MQ==","type":"BinaryComparator"}
    }
    </filter>
</Scanner>

您如何发现 JSON 过滤器字符串的外观?这是一个通过 Java 代码的简单方法,它在给定来自 HBase 的 Java API 的标准过滤器对象的情况下吐出字符串化过滤器。

SingleColumnValueFilter filter = new SingleColumnValueFilter(
    Bytes.toBytes("family"),
    Bytes.toBytes("col1"),
    CompareFilter.CompareOp.EQUAL,
    Bytes.toBytes("1")
);
System.out.println(ScannerModel.stringifyFilter(filter));

请注意,JSON 和 XML 需要以 Base64 编码的数据。我已经在一张桌子上测试了上面的 curl 命令,它工作得很好。

如果您想知道,是的,用于扫描仪的 REST API 还没有尽可能地对开发人员友好。

于 2012-07-10T13:12:47.937 回答