1

我正在努力寻找一种令人信服的 pythonic 方式在 dict 列表上进行分组,下面似乎具有良好的可读性,但不是最有效的方式:我必须先排序(groupby 的先决条件)然后进行分组by (这里的另一个问号是关于如何实现 itertools 中的 groupby ..)。

一个明显的选择是使用 collections.defaultdict 但我将不得不做很多 list.append (和更少的pythonic?)。你认为哪个是更好的选择?还是有其他更好的分组方式?谢谢

from itertools import groupby
from operator import itemgetter

data = [ {'x':1, 'y':1},
         {'x':2, 'y':2},
         {'x':3, 'y':2},
         {'x':4, 'y':1}, ]

sortedData = sorted(data, key=itemgetter('y'))

for y, d in groupby( sortedData, itemgetter('y')):
    print y, list(d)

1 [{'y': 1, 'x': 1}, {'y': 1, 'x': 4}]
2 [{'y': 2, 'x': 2}, {'y': 2, 'x': 3}]
4

2 回答 2

1

如您所知defaultdict,这是一种选择。我不确定“pythonicness”,但它似乎快两倍(正如你问的效率):

from collections import defaultdict
def f(l):
    d = defaultdict(list)
    for i in data: 
        d[i.get('y')].append(i)
    return d

%timeit f(data)
100000 loops, best of 3: 3.7 us per loop

%timeit {y:list(d) for y, d in groupby(sorted(data, key=itemgetter('y')),
                                                        itemgetter('y'))}
100000 loops, best of 3: 8.33 us per loop
于 2013-01-03T22:49:51.677 回答
1

要对无序列表进行分组,您需要检查列表中的每个对象,并将其放入一个组中:

def groupby(iterable, keyfunc=id):
    result = []
    groups = {}
    for item in iterable:
        key = keyfunc(item)
        group = groups.get(key)
        if group is None:
            groups[key] = group = []
            result.append((key,group))
        group.append(item)
    return result
于 2013-01-03T22:52:03.927 回答