基本上如果给出一个列表
events = [123,123,456,456,456,123]
我希望它返回 456,因为最后一次看到 456 早于最后一次看到 123。
我制作了由初始数字列表的计数和索引组成的列表。我还制作了一个字典,其中键是事件(原始部分)中的元素,hte 值是键的元素.count()
。
我真的不知道从这里去哪里,可以使用一些帮助。
基本上如果给出一个列表
events = [123,123,456,456,456,123]
我希望它返回 456,因为最后一次看到 456 早于最后一次看到 123。
我制作了由初始数字列表的计数和索引组成的列表。我还制作了一个字典,其中键是事件(原始部分)中的元素,hte 值是键的元素.count()
。
我真的不知道从这里去哪里,可以使用一些帮助。
查找最常出现的项目 (Counter.most_common)。然后在那些具有最小索引的候选中找到项目(枚举到索引字典中,{index: key}.iteritems() 的最小值)。
从@gnibbler 和@Jeff 大量窃取:
from collections import Counter
def most_frequent_first(events):
frequencies = Counter(events)
indexes = {event: i for i, event in enumerate(events)}
most_frequent_with_indexes = {indexes[key]: key for key, _ in frequencies.most_common()}
return min(most_frequent_with_indexes.iteritems())[1]
events = [123,123,456,456,456,123, 1, 2, 3, 2, 3]
print(most_frequent_first(events))
>>> print(most_frequent_first(events))
456
一段更好的代码会为您提供频率和索引,向您显示代码工作正常。这是一个使用 named_tuple 的实现:
from collections import Counter, namedtuple
frequent_first = namedtuple("frequent_first", ["frequent", "first"])
def most_frequent_first(events):
frequencies = Counter(events)
indexes = {event: i for i, event in enumerate(events)}
combined = {key: frequent_first(value, indexes[key]) for key, value in frequencies.iteritems()}
return min(combined.iteritems(), key=lambda t: (-t[1].frequent, t[1].first))
events = [123,123,456,456,456,123, 1, 2, 3, 2, 3]
print(most_frequent_first(events))
>>> print(most_frequent_first(events))
(456, frequent_first(frequent=3, first=4))
利用collections.counter
>>> import collections
>>> events = [123,123,456,456,456,123]
>>> counts = collections.Counter(events)
>>> print counts
Counter({456: 3, 123: 3})
>>> mostCommon = counts.most_common()
>>> print mostCommon
[(456, 3), (123, 3)]
那是困难的部分。
>>> from collections import Counter
>>> events = [123,123,456,456,456,123]
>>> c = Counter(events)
>>> idxs = {k: v for v,k in enumerate(events)}
>>> sorted(c.items(), key=lambda (k,v): (-v, idxs[k]))
[(456, 3), (123, 3)]