我在许多子目录中有很多文件,所有文件都以逗号分隔。我想按每个文件中的第一个字段分组并运行总记录数
A = LOAD '/files/*' USING PigStorage(',') as (f1, f2, f3, f4, f5);
B = GROUP A ALL;
C = GROUP B BY f1;
D = FOREACH C GENERATE COUNT(f1) ;
DUMP D;
这段代码给了我错误
无效的场投影。架构中不存在投影字段 [f1]:group:chararray,A:bag{:tuple(f1:chararray,f2:bytearray,f3:bytearray,f4:bytearray,f5:bytearray)}。