嗨,我想知道如何在 Hadoop Pig 中实现查找逻辑。我有一组记录,比如说一个博客用户,需要返回以获取他第一次访问(不是当前)的一些字段。
这在 Java 中是可行的,但我们有办法在 Hadoop pig 中实现它吗?
例子:
col1
假设要遍历一个由和标识的特定用户,在col2
中输出该用户的第一个值lookup_col
,在本例中为“1”。
col1 col2 lookup_col
---- ---- -----
326 8979 1
326 8979 4
326 8979 3
326 8979 0