我现在正在学习如何使用 Hadoop Pig。
如果我有这样的输入文件:
a,b,c,true
s,c,v,false
a,s,b,true
...
最后一个字段是我需要计算的...所以我想知道这个文件中有多少“真”和“假”。
我尝试:
records = LOAD 'test/input.csv' USING PigStorage(',');
boolean = foreach records generate $3;
groups = group boolean all;
现在我卡住了。我想使用:
count = foreach groups generate count('true');"
要获得“真”的数量,但我总是得到错误:
2013-08-07 16:32:36,677 [main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 1070:无法使用导入解析计数:[,org.apache.pig.builtin.,org.apache .pig.impl.builtin.] 日志文件中的详细信息:/etc/pig/pig_1375911119028.log
谁能告诉我问题出在哪里?