0

我有一个传入的数据集

(str,[[40,74],[50,75],[60,73],[70,43]])

我需要能够使用 pig 在输出变量中得到它:

str, 40, 74

str , 50, 75

str, 60, 73

str, 70, 43

这可能是可变的元素集。

尝试使用标记化然后展平,但这无济于事,因为它使用逗号创建标记。最终变成这样。。

str , {([[40), (74]), ... }

有人会建议我是否可以使用内置函数或为此编写 UDF。

非常感谢,安娜

4

1 回答 1

0

您将需要编写一个自定义 UDF 来解析它。假设您的数据没有比这更复杂,您可能可以通过使用String.splitwith delimiter的快速、浅层的解析方法摆脱困境"],["

于 2013-09-11T22:07:20.090 回答