我的任务是获取 HBase 表中数据的时间戳。如果我scan
在 hbase shell 中的表上执行操作,我可以看到给定行的时间戳,例如,
scan 'mytable', {LIMIT => 1}
ROW COLUMN+CELL
00001000715ce3d569ee256153d column=0:, timestamp=1326362691000, value=1320073315600x600
f31db629b
1 row(s) in 1.9800 seconds
如果我尝试在 grunt shell 中从这个表中加载一些数据,那么我看不到时间戳,只有值。
tableinput = LOAD 'hbase://imagestore-new'
USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('0: ', '-loadKey true')
AS (id:bytearray, thingy:chararray);
illustrate tableinput;
这给了我:
--------------------------------------------------------------------------------
| tableinput | id:bytearray | thingy:chararray |
--------------------------------------------------------------------------------
| | 0000bizrad8156b98bffa60d8968fba0f326 | {=1348461029160x130} |
--------------------------------------------------------------------------------
我严重缺乏关于如何将 HBaseStorage 与猪一起使用的信息。我唯一能找到的是 API 条目(http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/backend/hadoop/hbase/HBaseStorage.html)。我怀疑有一种方法可以在对 HBaseStorage 的调用中将其添加为配置,可能类似于'-loadKey true'
,但我不知道在哪里可以找到此信息。请帮忙!