我使用 LZO 来压缩减少输出。我试过这个:Kevin Weil 的 Hadoop-LZO 项目,然后LzoCodec
在我的工作中使用了类:
TextOutputFormat.setOutputCompressorClass(job, LzoCodec.class);
现在压缩工作得很好。
我的问题是压缩结果是一个.lzo_deflate
我无法解压缩的文件。
Lzop 实用程序似乎不支持该类型的文件。
LzopCodec
应该提供一个.lzo
文件,但它不起作用,但是它与LzoCodec
( org.apache.hadoop.io.compress
) 位于同一包中,这可能涉及兼容性问题,因为我使用旧 API (0.19) 来进行压缩。
这个问题的答案建议使用 Python 解决方案,但是我在 Java 中需要它。
我正在使用 Hadoop 1.1.2 和 Java 6。