在collections.Counter
中,该方法most_common(n)
仅返回列表中 n 个最频繁的项目。我正是需要这个,但我也需要包括相同的数量。
from collections import Counter
test = Counter(["A","A","A","B","B","C","C","D","D","E","F","G","H"])
-->Counter({'A': 3, 'C': 2, 'B': 2, 'D': 2, 'E': 1, 'G': 1, 'F': 1, 'H': 1})
test.most_common(2)
-->[('A', 3), ('C', 2)
我需要[('A', 3), ('B', 2), ('C', 2), ('D', 2)]
,因为在这种情况下它们的计数与 n=2 相同。我的真实数据是关于 DNA 代码的,可能非常大。我需要它有点效率。