我有这个加入。
A = Join smallTableBigEnoughForInMemory on (F1,F2) RIGHT OUTER, massive on (F1,F2);
B = Join anotherSmallTableBigforInMemory on (F1,F3 ) RIGHT OUTER, massive on (F1,F3);
由于两个连接都使用一个公共键,我想知道 COGROUP 是否可以用于有效地连接数据。请注意,这是一个 RIGHT 外连接。
我确实考虑过在 F1 上进行联合分组,但是小表在单个键上有多个组合(200-300),所以我没有使用单键连接。
我认为分区可能会有所帮助,但数据有偏差,我不确定如何在 Pig 中使用它