2

可能重复:
Pig 脚本:加入多个文件

我做了一个基于hadoop的程序。现在,我有三个文件 A、B、C。我想加入他们并遵循条件“A.one = B.one and A.two = C.one”;然后将结果存储到文件D。

我对pig有点了解,但是它的join不能满足这个命令。

4

1 回答 1

2

实际上在 Pig 中很容易,因为两步加入:

A=LOAD ..
B=LOAD ..
C=LOAD ..

AB= JOIN A BY A.one,B BY B.One;
D= JOIN AB BY A::two, C BY C.one;
于 2012-12-19T10:11:37.333 回答