场景如下:表record
如下:
A | B | C
1 | 1 | 1
2 | 1 | 1
3 | 1 | 1
4 | 1 | 2
5 | 1 | 2
6 | 1 | 3
HQL: 的结果select * from record where B = 1 and C < 3 limit 2
是:
A | B | C
1 | 1 | 1
2 | 1 | 1
但我想要的是:
A | B | C
1 | 1 | 1
2 | 1 | 1
4 | 1 | 2
5 | 1 | 2
那是:限制每个条件下的记录数,而不是限制最终返回的记录数。
我真的需要在蜂巢中完成此操作。谁能给我一个想法?非常感谢!
总结 这是解决这个问题的好方法: http ://ragrawal.wordpress.com/2011/11/18/extract-top-n-records-in-each-group-in-hadoopive/