我们有以下示例数据,必须使用 pig 脚本将其转换为输出格式
<< 示例 TSV >>
Id rank Value
12324 1 1582
12324 2 1142
12324 4 1292
12324 5 1134
12325 1 1582
12325 2 1142
12325 3 1292
12325 4 1134
12325 5 1183
12326 1 1582
12326 2 1142
12326 3 1292
12326 4 1134
12326 5 1183
我们需要比较每个 id 的每个等级的值(值列的)。
输出需要按以下格式生成
Id1 Id2
value_rank1 value_rank1
value_rank2 value_rank2
value_rank3 value_rank3
... ........
value_rankn value_rankn
例如
12324 12325 ..
1582 1582
1142 1142
1292
1292 1134
1134 1183
对于特定 id 的任何缺失排名,必须有一个空白值。
使用 pig 脚本有什么方法可以实现这一点吗?