我不确定这是否可以使用内置的 PIG 脚本来完成,或者我需要编写一个 UDF。但我基本上有一个表,我只是想转置数据。
简单地说,给定:
(1, 2, 3, 4, 5)
(6, 7, 8, 9, 10)
(11, 12, 13, 14, 15)
... 300 plus more tuples
我最终会得到:
(1,6,11,...) -> goes on for a few hundred more
(2,7,12,...)
(3,8,13,...)
(4,9,14,...)
(5,10,15,...)
关于我如何做到这一点的任何建议?