1

我对 PIG 的概念很陌生。现在我在 HDFS 上挂载了文件。当我使用加载文件时

A = LOAD 'user/vishal/output/part-00000' USING PigStorage(' ') as (name,occourence)

它正在发生,但是当我使用 FILTER 命令时

FLT = 按出现次数 > '20' 和出现次数 < '35' 过滤 A;

它给出了以下错误

2013-02-27 11:06:16,264 [main] WARN org.apache.pig.PigServer - 遇到警告 IMPLICIT_CAST_TO_CHARARRAY 6 次

可能是什么问题

谢谢

4

1 回答 1

1

pig 中列的默认数据类型是 bytearray。

出现应该是 int 数据类型,如下所示。

A = LOAD 'user/vishal/output/part-00000' USING PigStorage(' ') as (name:chararray,occourence:int);

现在您可以像下面这样过滤(不带引号)。

FLT = FILTER A by occourence > 20 and occourence < 35;
于 2013-02-27T06:57:02.850 回答