0

我创建了http://www.findnwrite.com/musings/extract-top-n-records-in-each-group-in-hadoopive/中提到的 UDF

执行语句“创建临时函数排名为'com.example.hive.udf.Rank';”后 我得到的日志如 http://pastebin.com/hHFa9G9A所示

如何解释日志或如何知道函数是否创建成功?

此外,当我使用函数 rank 执行配置单元查询时,我得到了 http://pastebin.com/fP5LnyGG中所述的异常

4

1 回答 1

1

这个问题解决了

文章本身的几个错误http://www.findnwrite.com/musings/extract-top-n-records-in-each-group-in-hadoopive/

将文章中的陈述替换为以下陈述

1)

Create Rank jar


jar -cf Rank.jar ./com/example/hive/udf/Rank.class

2)

SELECT user, category, value
FROM (
    SELECT user, category, rank(user) as rank, value
    FROM $compTable
    WHERE user is NOT NULL AND AND ctr > 0
    DISTRIBUTE BY user
    SORT BY user, value desc
) a
WHERE rank(user) < 5
ORDER BY user, rank(user)
于 2013-09-17T13:53:18.667 回答