我想加入 2 个表,但我对不同类型的连接有点迷茫
A(a_name:chararray, a_number:int)
a 1
b 2
c
d 3
e
B(b_id:int, b_name:chararray)
1 one
2 two
3 three
我知道我需要某种形式的加入,但与
AB = JOIN A by a_number, B by b_id;
FOREACH AB GENERATE
a_name,
b_name as a_number;
我明白了
a one
b two
d three
代替
a one
b two
c
d three
e
我真正想要的。我该怎么做?
编辑:
好的,我尝试了左连接,但它不保持行顺序而是返回
a one
b two
d three
c
e
任何解决方法?