我是 apache pig 的新手,希望通过编写 pig 脚本来实现自下而上的立方体。但是,这需要我以分层方式进行分组。
例如,如果我的数据采用 (exchange,symbol,date,dividend) 的形式,其中股息是衡量标准,其余是维度,我想首先按交易所对数据进行分组并打印总股息,然后再通过交易所和符号等。
一种方法是在脚本中编写所有可能的分组,例如按交换分组、按符号分组、按(交换、符号)分组等。然而,这似乎并不理想。有没有办法(例如)首先按交换分组,然后对于每个交换组,在内部按符号分组以生成(交换)的聚合,然后生成(交换,符号)的聚合,因为这样会更有效。
这里讨论了类似的东西,但它没有回答我的问题:我可以使用 Pig Latin 中的嵌套 FOREACH 语句生成嵌套包吗? 谢谢!