1

我有两个文件。我想按顺序合并它。如何使用 Pig/PigLatin 脚本来做到这一点?

f1.csv
1,aa
1,aa
1,ab
1,ac
2,bd
2,bd
2,bd
4,ab
4,bc

f2.csv
1,xxx
1,xxy
1,xyx
1,yxx
1,xyy
1,yyx
2,pqr
2,pq
2,pqrs
2,pqs
3,def

我需要的输出是

1,aa,1,xxy
1,aa,1,xyx
1,ab,1,yxx
1,ac,1,xyy
2,bd,2,pqr
2,bd,2,pq
2,bd,2,pqrs

谁能帮助我应该使用哪个加入以及如何获得它?

4

1 回答 1

3

1)加载每个文件。

2)然后将它们联合在一起

http://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#UNION

3) 存储新的联合别名。

PS 你可以设置 DEFAULT_PARALLEL 1;确保只输出一个文件。

于 2014-01-10T08:42:50.040 回答