我正在尝试按个人资料中至少有两个国家或来自美国的用户来过滤用户,我在 Pig 中尝试过
B = group A by userid;
C = foreach B {
count = $1.country;
count2 = distinct count;
GENERATE (((SIZE(count2) > 1 OR count2.$0 != 'USA') ? group : null)));
}
但它伴随着这个错误
incompatible types in NotEqual Operator left hand side:bag :tuple(country:chararray) right hand side:chararray
我尝试了各种其他组合,但没有运气。