18

在尝试解决更复杂的问题时,我开始比较对局部变量和成员变量的访问速度。

这里有一个测试程序:

#!/usr/bin/env python

MAX=40000000

class StressTestMember(object):
    def __init__(self):
        self.m = 0

    def do_work(self):
        self.m += 1
        self.m *= 2

class StressTestLocal(object):
    def __init__(self):
        pass

    def do_work(self):
        m = 0
        m += 1
        m *= 2

# LOCAL access test
for i in range(MAX):
    StressTestLocal().do_work()

# MEMBER access test
for i in range(MAX):
    StressTestMember().do_work()

StressTestMember我知道在每次迭代中实例化和实例化看起来可能是个坏主意,StressTestLocal但在这些基本上是 Active Record 的建模程序中它是有意义的。

经过一个简单的基准测试,

  • 本地访问测试:0m22.836
  • MEMBER访问测试:0m32.648s

本地版本的速度提高了约 33%,同时仍然是课程的一部分。为什么?

4

2 回答 2

29

self.m += 1意味着您必须查找一个名为的局部变量self,然后找到名为的属性m

当然,如果你只需要查找一个局部变量,那么没有额外的步骤会更快。

查看幕后发生的事情可能很有用:

>>> import dis
>>> dis.dis(StressTestLocal.do_work)
 18           0 LOAD_CONST               1 (0)
              3 STORE_FAST               1 (m)

 19           6 LOAD_FAST                1 (m)
              9 LOAD_CONST               2 (1)
             12 INPLACE_ADD         
             13 STORE_FAST               1 (m)

 20          16 LOAD_FAST                1 (m)
             19 LOAD_CONST               3 (2)
             22 INPLACE_MULTIPLY    
             23 STORE_FAST               1 (m)
             26 LOAD_CONST               0 (None)
             29 RETURN_VALUE        
>>> dis.dis(StressTestMember.do_work)
 10           0 LOAD_FAST                0 (self)
              3 DUP_TOP             
              4 LOAD_ATTR                0 (m)
              7 LOAD_CONST               1 (1)
             10 INPLACE_ADD         
             11 ROT_TWO             
             12 STORE_ATTR               0 (m)

 11          15 LOAD_FAST                0 (self)
             18 DUP_TOP             
             19 LOAD_ATTR                0 (m)
             22 LOAD_CONST               2 (2)
             25 INPLACE_MULTIPLY    
             26 ROT_TWO             
             27 STORE_ATTR               0 (m)
             30 LOAD_CONST               0 (None)
             33 RETURN_VALUE        
于 2012-09-13T01:00:40.073 回答
7

本地名称更快,因为 Python 做了一些优化,本地名称不需要 dict 访问,另一方面,实例属性需要访问__dict__对象的。

这也是局部名称比全局名称快的原因。

于 2012-09-13T00:57:04.470 回答