每个人,在蜂巢中,我们使用
select word,count(*) as cnt from table group by word order by cnt limit N
用于前 N 个查询。
由于我们知道速度并不快,所以我学习了一些用于top-k查询的近似算法,例如countsketch算法或其他算法。
我们可以在 hive 中添加近似算法以加快 top-k 查询吗?
每个人,在蜂巢中,我们使用
select word,count(*) as cnt from table group by word order by cnt limit N
用于前 N 个查询。
由于我们知道速度并不快,所以我学习了一些用于top-k查询的近似算法,例如countsketch算法或其他算法。
我们可以在 hive 中添加近似算法以加快 top-k 查询吗?