我正在使用 PIG 处理 HBase 表中的行。HBase 表中的值存储为字节数组。
我不知道是否必须编写一个将字节数组转换为各种类型的 UDF,或者 pig 是否会自动执行此操作。
我有以下脚本:
raw = LOAD 'hbase://TABLE' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('CF:I') AS (product_id:bytearray);
ids = FOREACH raw GENERATE (int)product_id;
dump ids;
我得到一个括号列表'()'
。
根据文档,它应该可以工作。我检查了 hbase shell 中的值,它们都是 value=\x00\x00\x00\x02
我怎样才能让它工作?