在我的 Pig 脚本 (0.9.2) 中,我的最终输出如下所示:
final: {email: chararray,{(name: chararray,percent: double)}}
对于每个电子邮件地址,我最多有 3 个名称和分数。所以,输出看起来像这样:
joe@smith.com {(Joe Smith, 0.5),(Joseph, 0.1), (Joey, 0.1)}
我真正想做的是将它展平为标签分隔的值(没有括号或花括号),以便更容易拉入这样的 MySQL 表:
joe@smith.com Joe Smith 0.5 Joseph 0.1 Joey 0.1
我怎样才能在 Pig 中做到这一点?还是我必须编写自定义 UDF?