如果有这样的数据:
A = LOAD 'data' AS (a1:int,a2:int,a3:int);
DUMP A;
(1,2,3)
(4,2,1)
然后在 A、A 上进行交叉连接:
B = CROSS A, A;
DUMP B;
(1,2,3)
(4,2,1)
为什么第二个 A 从查询中优化出来?
信息:猪版本 0.11
== 更新 ==
如果我对 A 进行排序:
C = ORDER A BY a1;
D = CROSS A, C;
它将给出正确的交叉连接。