我写了我的 UDF 来将文件加载到 Pig 中。它适用于加载文本文件,但是,现在我还需要能够读取.gz文件。我知道我可以解压缩文件然后处理,但我只想读取.gz文件而不解压缩它。
我有我的 UDF 扩展自LoadFunc,然后在我的 costom 输入文件MyInputFile extends TextInputFormat中。我也实现了MyRecordReader。只是想知道扩展TextInputFormat是否是问题所在?我试过FileInputFormat了,仍然无法读取文件。.gz以前有人写过UDF从文件中读取数据吗?