0

我有一个猪输出文件,其原始数据看起来像这样(2 个字段):

(45578713,45578728,)    8139

第一个字段是以前猪工作的组字段(我无法更改)。

现在我需要阅读这篇文章,我想将第一个字段 - (45578713,45578728,) - 分解为如下的单个数字(总共 3 个字段)

45578713        45578728        8139

我怎样才能做到这一点?我尝试使用 Pig 流,但我觉得我必须可以直接从 Pig 做一些事情。

4

1 回答 1

1

这应该可以帮助你。

m = FOREACH g GENERATE FLATTEN(group), number;

看看FLATTEN运营商。

于 2013-04-15T23:43:39.773 回答