我有一份男性和女性的姓名和人数列表。看起来像这样
亚伯 32898 82
卡兰 1087 868
Pig中计算男性总数和女性总数的最佳方法是什么?
看看GROUP ALL操作:
data = LOAD 'data' AS (name:CHARARRAY, males_count:INT, females_count:INT);
data_all = GROUP data ALL;
counts = FOREACH data_all GENERATE SUM(data.males_count) AS tot_males, SUM(data.females_count) AS tot_females;