我正在使用 Pig 解析我的应用程序日志,以了解上个月未调用的用户(由同一用户)调用了哪些公开的方法。
我已经设法在上个月之前和上个月之后获得了由用户分组的方法:
上个月之前的关系样本
u1 {(m1),(m2)}
u2 {(m3),(m4)}
上个月之后的关系样本
u1 {(m1),(m3)}
u2 {(m1),(m4)}
我想要的是由用户找到哪些方法在 AFTER 中而不在 BEFORE 中,即
NEWLY_CALLED 预期结果
u1 {(m3)}
u2 {(m1)}
问题:我怎样才能在 Pig 中做到这一点?可以减去袋子吗?
我已经尝试过 DIFF 函数,但它没有执行预期的减法。
问候,
乔尔