4

我有一个字典{key: count},比如说 status_count = {'MANAGEMENT ANALYSTS': 13859, 'COMPUTER PROGRAMMERS': 72112} ,我正在尝试为 heapq.nlargest() 编写一个基于计数排序的键函数,如果有关系,我必须根据键的字母顺序(az)进行排序。我必须使用 heapq.nlargest 因为非常大的 N 和小 k = 10。

这是我到现在得到的,

top_k_results = heapq.nlargest(args.top_k, status_count.items(), key=lambda item: (item[1], item[0])) 但是,如果按字母顺序打破联系,这将是不正确的。请帮忙!

4

1 回答 1

1

最简单的可能是切换到heapq.nsmallest并重新定义您的排序键:

from heapq import nsmallest

def sort_key(x):
    return -x[1], x[0]

top_k_results = nsmallest(args.top_k, status_count.items(), key=sort_key)

或者,您可以使用ord并取负数进行升序:

from heapq import nlargest

def sort_key(x):
    return x[1], [-ord(i) for i in x[0]]

top_k_results = nlargest(args.top_k, status_count.items(), key=sort_key)

str.casefold如果您需要规范化字符串的大小写,请记住使用。

于 2018-10-30T10:29:02.207 回答