我的关系中的一列包含分隔值(例如 csv),我想将它们分解为这些值,以便我在关系中为每个值都有一个条目(与其他具有原子值的列相结合)。例如,如果我有以下数据:
SomeID|Age|CommaSeperatedNames
1 |23 |Steve,Joe,Bob
2 |26 |Dan,Mike,Tom
我希望得到的关系包含:
SomeID|Age|Names
1 |23 |Steve
1 |23 |Joe
1 |23 |Bob
2 |26 |Dan
2 |26 |Mike
2 |26 |Tom
这可以仅使用 PigLatin 和内置/piggybank UDFS 来完成吗?注意:我有一个涉及我编写的 UDF 的 hacky 解决方案,我想知道这是否可以仅使用 Pig。