我有一个字符串源(假设是一个文本文件),并且许多字符串重复了多次。我需要按出现次数递减的顺序获取前 X 个最常见的字符串。
首先想到的想法是创建一个可排序的 Bag(类似于org.apache.commons.collections.bag.TreeBag)并提供一个比较器,它将按照我需要的顺序对条目进行排序。但是,我无法弄清楚我需要比较的对象类型是什么。它应该是某种内部映射,它结合了我的对象(字符串)和出现次数,由 TreeBag 内部生成。这可能吗?
或者我会更好地通过简单地使用哈希图并按值对其进行排序,例如Java sort HashMap by value