我有这样的一行数据:
a\tb1,b2,..,bn\tc1,c2,..,cn
其中 n 是不确定的。现在,我想将其转换为如下几行:
a\tb1\tc1
a\tb2\tc2
...
a\tbn\tcn
可以通过猪拉丁语实现,还是必须使用UDF?如果使用脚本:
A = LOAD 'file' AS (a, b, c);
B = FOREACH A GENERATE a, FLATTEN(TOKENIZE(b)), FLATTEN(TOKENIZE(c));
dump B;
我将得到如下结果:
a\tb1\tc1
a\tb1\tc2
..
a\tb1\tcn
a\tb2\tc1
a\tb2\tc2
..
a\tb2\tcn
..
这不是我想要的数据。有人有想法吗?