我的问题很简单。Pig (Hadoop) 可以处理 ebcdic 文件吗?我有一些,我想在 Hadoop 平台中使用 Pig 来处理和处理它们。
目前我已经保存了文件并尝试按如下方式加载它:
A = LOAD '/user/enrico/FilesForPigs/IRIS.txt' AS (f1,f2,f3);
它似乎有效,但是当我尝试输入: DUMP A; 我收到一个错误。
编辑:
按照唐纳德的建议,我正在尝试创建一个 Java 程序来进行转换,特别是我正在尝试创建自己的 LOAD 函数。
实际上,我在代码中有以下问题:
@Override
public InputFormat getInputFormat() {
return new TextInputFormat();
}
这是我找到的示例,但 TextInputFormat 不适合我的情况。你知道我该如何解决吗?
谢谢