我正在使用 Pig 获取表格的一个大 txt 文件
上校 | 上校 B | 上校 C | 科尔D | 上校 | 上校 F | 科尔G
我的目标是获取这些输入并按列的各种组合进行分组以获得类似的结果
(Col A / Col B) | 计数(Col F) | 总和(Col G)
(Col A / Col C) | 计数(Col F) | 总和(Col G)
(Col A / Col D) | 计数(Col F) | 总和(Col G)
(Col B / Col C) | 计数(Col F) | 总和(Col G)
我想知道是否有办法构建我的猪代码,以便只需要尽可能少地处理数据,因为输入保持不变并且所有正在改变的只是分组。
提前致谢。