我有一个文件,我试图将它加载到用 snappy 压缩的 pig 中。我在 grunt 中设置了配置选项,就像在这个 jira 问题中描述的那样,但我仍然在结果中获得压缩数据。
当我运行该作业时,它确实说:org.apache.hadoop.io.compress.snappy.LoadSnappy - Snappy 本机库可用
对于这项工作,我使用 PigStorage() as (x, y, z) 做了一个简单
的 a = load '/path/to/snappy/file'
然后:
转储数据
将输出压缩数据。
有谁知道我可以做些什么来正确读取数据?提前致谢。