1

我有格式的数据

1,1.2
2,1.3
and so on..

所以基本上这是 id,val 组合,其中 id 是唯一的......

我想计算所有值的平均值..

So here.. avg(1.2,1.3)

我正在阅读文档,但大多数聚合功能都涉及按一些 id 分组..然后使用 AVG ......但是由于 id 是唯一的..我如何对它们进行分组???所以基本上这项努力的结果将是一个浮动。任何建议将不胜感激。

谢谢

4

1 回答 1

2

GROUP X ALL应该解决你的问题:)

A = LOAD 'data' USING PigStorage(') AS (f1:int, f2:int);
B = GROUP A ALL;
AV = FOREACH B GENERATE AVG(A.f1);
DUMP AV;
于 2012-11-06T19:38:05.080 回答