8

迟到且可能很愚蠢的部门提出:

>>> import multiprocessing
>>> mgr = multiprocessing.Manager()
>>> d = mgr.dict()
>>> d.setdefault('foo', []).append({'bar': 'baz'})
>>> print d.items()
[('foo', [])]         <-- Where did the dict go?

然而:

>>> e = mgr.dict()
>>> e['foo'] = [{'bar': 'baz'}]
>>> print e.items()
[('foo', [{'bar': 'baz'}])]

版本:

>>> sys.version
'2.7.2+ (default, Jan 20 2012, 23:05:38) \n[GCC 4.6.2]'

虫子还是乌戈?

编辑:更多相同,在 python 3.2 上:

>>> sys.version
'3.2.2rc1 (default, Aug 14 2011, 21:09:07) \n[GCC 4.6.1]'

>>> e['foo'] = [{'bar': 'baz'}]
>>> print(e.items())
[('foo', [{'bar': 'baz'}])]

>>> id(type(e['foo']))
137341152
>>> id(type([]))
137341152

>>> e['foo'].append({'asdf': 'fdsa'})
>>> print(e.items())
[('foo', [{'bar': 'baz'}])]

dict 代理中的列表如何不包含附加元素?

4

3 回答 3

9

这是一些非常有趣的行为,我不确定它是如何工作的,但我会解释一下为什么这种行为是这样的。

首先,注意multiprocessing.Manager().dict()不是 a dict,它是一个DictProxy对象:

>>> d = multiprocessing.Manager().dict()
>>> d
<DictProxy object, typeid 'dict' at 0x7fa2bbe8ea50>

该类的目的DictProxy是为您提供dict跨进程共享的安全性,这意味着它必须在正常dict功能之上实现一些锁定。

显然,这里实现的一部分是不允许您直接访问嵌套在 a 中的可变对象DictProxy,因为如果允许,您将能够以绕过所有可以DictProxy安全使用的锁定的方式修改共享对象。

这里有一些证据表明您无法访问可变对象,这与正在发生的事情类似setdefault()

>>> d['foo'] = []
>>> foo = d['foo']
>>> id(d['foo'])
140336914055536
>>> id(foo)
140336914056184

使用普通字典,您会期望d['foo']foo指向同一个列表对象,而对其中一个对象的修改将修改另一个。DictProxy如您所见,由于多处理模块施加了额外的过程安全要求,因此该类并非如此。

编辑:多处理文档中的以下注释阐明了我上面想说的内容:


注意:对 dict 和 list 代理中的可变值或项的修改不会通过管理器传播,因为代理无法知道其值或项何时被修改。要修改此类项目,您可以将修改后的对象重新分配给容器代理:

# create a list proxy and append a mutable object (a dictionary)
lproxy = manager.list()
lproxy.append({})
# now mutate the dictionary
d = lproxy[0]
d['a'] = 1
d['b'] = 2
# at this point, the changes to d are not yet synced, but by
# reassigning the dictionary, the proxy is notified of the change
lproxy[0] = d

根据上述信息,您可以通过以下方式重写原始代码以使用DictProxy

# d.setdefault('foo', []).append({'bar': 'baz'})
d['foo'] = d.get('foo', []) + [{'bar': 'baz'}]

正如 Edward Loper 在评论中所建议的那样,编辑上面的代码以使用 get() 而不是 setdefault().

于 2012-05-29T23:09:12.147 回答
2

Manager().dict() 是一个 DictProxy 对象:

>>> mgr.dict()
<DictProxy object, typeid 'dict' at 0x1007bab50>
>>> type(mgr.dict())
<class 'multiprocessing.managers.DictProxy'>

DictProxy 是 BaseProxy 类型的子类,它的行为并不完全像普通的 dict:http ://docs.python.org/library/multiprocessing.html?highlight=multiprocessing#multiprocessing.managers.BaseProxy

因此,您似乎必须以不同于基本 dict 的方式处理 mgr.dict() 。

于 2012-05-29T23:01:48.920 回答
0

items() 返回一个副本。附加到副本不会影响原件。你是这个意思吗?

>>> d['foo'] =({'bar': 'baz'})
>>> print d.items()
[('foo', {'bar': 'baz'})]
于 2012-05-29T23:00:26.833 回答