以下是我在 Pig 脚本中操作的元组:
DUMP A
(4,20,53,31)
(21,3,40,16)
(15,51,12,3)
我会将这个关系 (A) 转换为另一个关系 (B),例如:
DUMP B
(4,20)
(4,53)
(4,31)
(21,3)
(21,40)
(21,16)
(15,51)
(15,12)
(15,3)
这意味着保留所有元组中的第一个字段并按每个字段获取一个元组。在前面的示例中,每个元组必须提供 3 个新元组。我有一个解决方案:
DUMP B
(4,20)
(21,3)
(15,51)
(4,53)
(21,40)
(15,12)
(4,31)
(21,16)
(15,3)
这是一个好的结果,但顺序错误(我每次都使用 FOREACH 运算符)。我可以通过向每个元组添加一个字段然后使用 ORDER 运算符来获得正确的顺序,但我认为有一种更简单的方法可以做到这一点。
任何想法?
谢谢你。