0

我有这个数据结构

data: {mid: bytearray,country_code: bytearray,cnt: long}

4679201,RUS,1
4679201,GB,1
4679201,US,1
4681046,GB,2
4681046,TR,1
4681046,FR,1

我需要遍历每个“中间”值并将其相应的数据存储在“csv”文件中。

STORE mid_data INTO '/mypath/4681046';

输出文件如下所示:

GB,2
TR,1
FR,1

看起来已经有一个函数(org.apache.pig.piggybank.storage.MultiStorage)可以做到这一点,除了我不希望我的密钥(mid)成为输出的一部分。

谢谢

萨德克

4

1 回答 1

0

要在输出文件中仅存储最后 2 列,请使用 FOREACH。

前任:

view = FOREACH mid_data GENERATE country_code, cnt;
STORE view INTO '/yourpath/3452345';
于 2012-08-08T21:42:59.097 回答