我正在尝试使用 PIG (hadoop) 读取 ebcdic IBM 文件,因此我需要创建自定义加载函数。
默认的 getInputFormat() 如下:
@Override
public InputFormat getInputFormat() {
return new TextInputFormat();
}
我想我需要编写自己的 InputFormat 来读取 ebcdic 文件,对吗?如果是,我该怎么做?
我正在尝试使用 PIG (hadoop) 读取 ebcdic IBM 文件,因此我需要创建自定义加载函数。
默认的 getInputFormat() 如下:
@Override
public InputFormat getInputFormat() {
return new TextInputFormat();
}
我想我需要编写自己的 InputFormat 来读取 ebcdic 文件,对吗?如果是,我该怎么做?