14

有谁知道 Python 中是否有用于无限嵌套字典的标准类?

我发现自己在重复这种模式:

d = defaultdict(lambda: defaultdict(lambda: defaultdict(int)))
d['abc']['def']['xyz'] += 1

如果我想添加“另一层”(例如d['abc']['def']['xyz']['wrt']),我必须定义另一个 defaultdicts 嵌套。

为了概括这种模式,我编写了一个简单的类,它重写__getitem__以自动创建下一个嵌套字典。

例如

d = InfiniteDict(('count',0),('total',0))
d['abc']['def']['xyz'].count += 0.24
d['abc']['def']['xyz'].total += 1
d['abc']['def']['xyz']['wrt'].count += 0.143
d['abc']['def']['xyz']['wrt'].total += 1

但是,有谁知道这个想法的预先存在的实现?我试过谷歌搜索,但我不确定这会叫什么。

4

6 回答 6

19

我认为这个单线是一个近乎完美的解决方案:

>>> from collections import defaultdict
>>> infinite_defaultdict = lambda: defaultdict(infinite_defaultdict)
>>> d = infinite_defaultdict() 
>>> d['x']['y']['z'] = 10

雷蒙德·海廷格在推特上(https://twitter.com/raymondh/status/343823801278140417

于 2013-06-09T23:51:41.863 回答
15

这自然适用于递归定义。

>>> import collections
>>> def nested_dd():
...     return collections.defaultdict(nested_dd)
...
>>> foo = nested_dd()
>>> foo
defaultdict(<function nested_dd at 0x023F0E30>, {})
>>> foo[1][2]=3
>>> foo[1]
defaultdict(<function nested_dd at 0x023F0E30>, {2: 3})
>>> foo[1][2]
3
于 2010-11-14T16:09:09.363 回答
14

您可以从中defaultdict获得您想要的行为:

class InfiniteDict(defaultdict):
   def __init__(self):
      defaultdict.__init__(self, self.__class__)

class Counters(InfiniteDict):
   def __init__(self):
      InfiniteDict.__init__(self)                                               
      self.count = 0
      self.total = 0

   def show(self):
      print "%i out of %i" % (self.count, self.total)

此类的用法如下所示:

>>> d = Counters()
>>> d[1][2][3].total = 5
>>> d[1][2][3].show()
0 out of 5
>>> d[5].show()
0 out of 0
于 2010-11-14T16:13:35.543 回答
4

理想的解决方案,灵感来自某物的回答:

from collections import defaultdict

class InfiniteDict(defaultdict):
   def __init__(self, **kargs):
      defaultdict.__init__(self, lambda: self.__class__(**kargs))
      self.__dict__.update(kargs)

d = InfiniteDict(count=0, total=0)
d['abc']['def'].count += 0.25
d['abc']['def'].total += 1
print d['abc']['def'].count
print d['abc']['def'].total
d['abc']['def']['xyz'].count += 0.789
d['abc']['def']['xyz'].total += 1
print d['abc']['def']['xyz'].count
print d['abc']['def']['xyz'].total
于 2010-11-14T16:31:03.487 回答
3

万一八年后您仍在考虑如何使用单线实现此目的:

from collections import defaultdict

t = defaultdict(lambda: defaultdict(t.default_factory))
于 2018-09-25T12:59:55.107 回答
0

这很接近:

class recursivedefaultdict(defaultdict):
    def __init__(self, attrFactory=int):
        self.default_factory = lambda : type(self)(attrFactory)
        self._attrFactory = attrFactory
    def __getattr__(self, attr):
        newval = self._attrFactory()
        setattr(self, attr, newval)
        return newval

d = recursivedefaultdict(float)
d['abc']['def']['xyz'].count += 0.24  
d['abc']['def']['xyz'].total += 1  

data = [
    ('A','B','Z',1),
    ('A','C','Y',2),
    ('A','C','X',3),
    ('B','A','W',4),
    ('B','B','V',5),
    ('B','B','U',6),
    ('B','D','T',7),
    ]

table = recursivedefaultdict(int)
for k1,k2,k3,v in data:
    table[k1][k2][k3] = v

这不是您想要的,因为嵌套最深的级别没有“count”或“total”的默认 0 值。

编辑:啊,这现在有效 - 只需要添加一个__getattr__方法,这就是你想要的。

编辑2:现在您可以为属性定义其他工厂方法,除了整数。但是它们都必须是相同的类型,不能让 count 为 float 并且 total 为 int。

于 2010-11-14T16:10:22.303 回答