我们可以加载可写 KEY,VALUE 对的序列文件,并使用 LoadCaster 接口将 KEY,VALUE 对转换为 pig 数据类型,以将原始字节数组转换为 pig 数据类型吗?
如果是这样,是否有一些用于加载序列文件和调用 LoadCaster 的猪代码示例?
具体来说,我目前正在这样做:
A = LOAD '/tmp/part-m-00000' using SequenceFileLoader AS (key:bytearray, value:bytearray);
到目前为止这有效,但我不知道现在使用我自己创建的 LoadCaster 对象将键和值转换为它们各自的元组的 pig 语法。