25

我正在使用 Python 3.6 和来自ericvsmithdataclasses的backport 包。

似乎 calldataclasses.asdict(my_dataclass)比 call 慢 10 倍my_dataclass.__dict__

In [172]: @dataclass
     ...: class MyDataClass:
     ...:     a: int
     ...:     b: int
     ...:     c: str
     ...: 

In [173]: %%time
     ...: _ = [MyDataClass(1, 2, "A" * 1000).__dict__ for _ in range(1_000_000)]
     ...: 
CPU times: user 631 ms, sys: 249 ms, total: 880 ms
Wall time: 880 ms

In [175]: %%time
     ...: _ = [dataclasses.asdict(MyDataClass(1, 2, "A" * 1000)) for _ in range(1_000_000)]
     ...: 
CPU times: user 11.3 s, sys: 328 ms, total: 11.6 s
Wall time: 11.7 s

这是预期的行为吗?在什么情况下我应该使用dataclasses.asdict(obj)而不是obj.__dict__


编辑:使用__dict__.copy()并没有太大的区别:

In [176]: %%time
     ...: _ = [MyDataClass(1, 2, "A" * 1000).__dict__.copy() for _ in range(1_000_000)]
     ...: 
CPU times: user 922 ms, sys: 48 ms, total: 970 ms
Wall time: 970 ms
4

1 回答 1

46

在大多数情况下,您可能会在__dict__没有的情况下使用dataclasses,您可能应该继续使用__dict__,也许还需要copy调用。asdict做了很多你可能并不真正想要的额外工作。这就是它的作用。


首先,来自文档

每个数据类都转换为其字段的字典,如名称:值对。数据类、字典、列表和元组被递归到。例如:

@dataclass
class Point:
     x: int
     y: int

@dataclass
class C:
     mylist: List[Point]

p = Point(10, 20)
assert asdict(p) == {'x': 10, 'y': 20}

c = C([Point(0, 0), Point(10, 4)])
assert asdict(c) == {'mylist': [{'x': 0, 'y': 0}, {'x': 10, 'y': 4}]}

因此,如果您想要递归数据类命令,请使用asdict. 如果您不想要它,那么提供它的所有开销都将被浪费。特别是,如果您使用asdict,则更改要使用的包含对象的实现dataclass将改变asdict外部对象的结果。


除此之外,asdict构建一个的字典,同时__dict__直接访问对象的属性字典。的返回值asdict不会受到重新分配原始对象字段的影响。此外,asdict使用fields, 因此,如果您将属性添加到与声明的字段不对应的数据类实例,asdict则不会包含它们。

最后,文档根本没有提到它,但asdict调用deepcopy不是数据类对象、字典、列表或元组的所有内容:

else:
    return copy.deepcopy(obj)

(数据类对象、字典、列表和元组通过递归逻辑,它也构建一个副本,只是应用了递归命令。)

deepcopy它本身确实很昂贵,并且缺乏任何可能在非平凡对象图中创建共享对象的多个副本的memo处理手段。asdict请注意:

>>> from dataclasses import dataclass, asdict
>>> @dataclass
... class Foo:
...     x: object
...     y: object
... 
>>> a = object()
>>> b = Foo(a, a)
>>> c = asdict(b)
>>> b.x is b.y
True
>>> c['x'] is c['y']
False
>>> c['x'] is b.x
False
于 2018-09-07T20:58:34.080 回答