python - pythonic方式在dict列表上进行groupby（并且有效？）

Question

我正在努力寻找一种令人信服的 pythonic 方式在 dict 列表上进行分组，下面似乎具有良好的可读性，但不是最有效的方式：我必须先排序（groupby 的先决条件）然后进行分组by （这里的另一个问号是关于如何实现 itertools 中的 groupby ..）。

一个明显的选择是使用 collections.defaultdict 但我将不得不做很多 list.append （和更少的pythonic？）。你认为哪个是更好的选择？还是有其他更好的分组方式？谢谢

from itertools import groupby
from operator import itemgetter

data = [ {'x':1, 'y':1},
         {'x':2, 'y':2},
         {'x':3, 'y':2},
         {'x':4, 'y':1}, ]

sortedData = sorted(data, key=itemgetter('y'))

for y, d in groupby( sortedData, itemgetter('y')):
    print y, list(d)

1 [{'y': 1, 'x': 1}, {'y': 1, 'x': 4}]
2 [{'y': 2, 'x': 2}, {'y': 2, 'x': 3}]

score 1 · Accepted Answer

如您所知defaultdict，这是一种选择。我不确定“pythonicness”，但它似乎快两倍（正如你问的效率）：

from collections import defaultdict
def f(l):
    d = defaultdict(list)
    for i in data: 
        d[i.get('y')].append(i)
    return d

%timeit f(data)
100000 loops, best of 3: 3.7 us per loop

%timeit {y:list(d) for y, d in groupby(sorted(data, key=itemgetter('y')),
                                                        itemgetter('y'))}
100000 loops, best of 3: 8.33 us per loop

score 1 · Accepted Answer

要对无序列表进行分组，您需要检查列表中的每个对象，并将其放入一个组中：

def groupby(iterable, keyfunc=id):
    result = []
    groups = {}
    for item in iterable:
        key = keyfunc(item)
        group = groups.get(key)
        if group is None:
            groups[key] = group = []
            result.append((key,group))
        group.append(item)
    return result

python - pythonic方式在dict列表上进行groupby（并且有效？）

2 回答 2

Related

Reference