我的字典里有 100 万个单词。每当用户在我的网站上发出查询时,我都会查看查询是否包含我的字典中的单词,并分别增加与它们对应的计数器。下面是一个例子,假设用户输入“奥巴马是总统”并且“奥巴马”和“总统”在我的字典中,那么我应该将“奥巴马”和“总统”的计数器加 1。
有时,我想查看前 100 个单词(查询最多的单词)。如果我使用 Hbase 来存储计数器,我应该使用什么模式?- 我还没有想出一个有效的。
如果我将字典中的单词用作行键,将“计数器”用作列键,那么更新计数器(增量)非常有效。但是很难排序并返回前 100 名。
任何人都可以给一个好的建议吗?谢谢。