algorithm - 蜂巢中top-k查询的近似算法？

翻译自：https://stackoverflow.com/questions/12050125 2012-08-21T07:28:28.970

351 次

每个人，在蜂巢中，我们使用

select word,count(*) as cnt from table group by word order by cnt limit N

用于前 N 个查询。
由于我们知道速度并不快，所以我学习了一些用于top-k查询的近似算法，例如countsketch算法或其他算法。
我们可以在 hive 中添加近似算法以加快 top-k 查询吗？

0 回答 0