我写了我的 UDF 来将文件加载到 Pig 中。它适用于加载文本文件,但是,现在我还需要能够读取.gz
文件。我知道我可以解压缩文件然后处理,但我只想读取.gz
文件而不解压缩它。
我有我的 UDF 扩展自LoadFunc
,然后在我的 costom 输入文件MyInputFile extends TextInputFormat
中。我也实现了MyRecordReader
。只是想知道扩展TextInputFormat
是否是问题所在?我试过FileInputFormat
了,仍然无法读取文件。.gz
以前有人写过UDF从文件中读取数据吗?