4

我想要一个具有以下属性的字典结构:

  1. 双重嵌套(所以,在这么多单词中是 3 维的)
  2. 记住每个级别添加到其中的事物的顺序

所以,如果我像这样向它添加项目:

# d = something dict-ish
d['a']['b']['c'] = 'd'
d['a'][1][2] = 3
d['f']['g']['e'] = 'g'
d['f'][5][6] = 7
d['a']['foo']['bar'] = 'hello world'

以下理解的结果:

[(i, j, k, d[i][j][k]) for i in d for j in d[i] for k in d[i][j]]

将会:

[('a', 'b', 'c', 'd'), ('a', 1, 2, 3), ('a', 'foo', 'bar', 'hello world'), ('f', 'g', 'e', 'g'), ('f', 5, 6, 7)]

我尝试使用 adefaultdict来为新键强制执行此结构,因此我不必长时间键入它,如下所示:

# long way
d = OrderedDict()
d['a'] = OrderedDict([('b', OrderedDict([('c', 'd')]))])
d['a'][1] = OrderedDict([(2,3)])

# tried to use defaultdict
d = defaultdict(lambda: defaultdict(lambda: OrderedDict()))
d['a']['b']['c'] = 'd'
d['a'][1][2] = 3

但是defaultdict不记得前两个级别的顺序。我不确定如何合并行为,因此显然前两个级别正在产生defaultdict行为,因为我已声明d如此。我怎样才能实现我想要的结构?

4

2 回答 2

6

您只需要子类化OrderedDict并添加一个__missing__函数:

from collections import OrderedDict

class DefaultOrderedDict(OrderedDict):
    def __missing__(self, key):
        self[key] = type(self)()
        return self[key]

默认 dict类型将在引发 a 之前调用一个方法(__missing__如果存在KeyError),这是该defaultdict类型所使用的。

请参阅dict文档(向下滚动到d[key]说明):

2.5 版中的新功能:如果 dict 的子类定义了一个方法__missing__(),如果键key不存在,则d[key]操作以键key作为参数调用该方法。然后,如果键不存在,则该d[key]操作将返回或引发调用返回或引发的任何内容。__missing__(key)没有其他操作或方法调用__missing__(). 如果__missing__()未定义,KeyError则引发。__missing__()必须是方法;它不能是实例变量。

演示:

>>> d = DefaultOrderedDict()
>>> d['a']['b']['c'] = 'd'
>>> d['a'][1][2] = 3
>>> d['f']['g']['e'] = 'g'
>>> d['f'][5][6] = 7
>>> d['a']['foo']['bar'] = 'hello world'
>>> [(i, j, k, d[i][j][k]) for i in d for j in d[i] for k in d[i][j]]
[('a', 'b', 'c', 'd'), ('a', 1, 2, 3), ('a', 'foo', 'bar', 'hello world'), ('f', 'g', 'e', 'g'), ('f', 5, 6, 7)]
于 2013-07-22T19:55:23.183 回答
1

老套路:

data = [('a','b','c','d'), ('a',1,2,3), ('f,'g','e','g'), ('f',5,6,7), (a','foo','bar','hello world')]

answer = OrderedDict()
for d in data:
    if d[0] not in answer:
        answer[d[0]] = OrderedDict()
    if d[1] not in answer[d[0]]:
        answer[d[0]][d1] = OrderedDict()
    if d[2] not in answer[d[0]][d1]:
        answer[d[0]][d1][d2] = OrderedDict()
    answer[d[0]][d1][d2] = d[3]
于 2013-07-22T19:57:03.280 回答