110

好的,请耐心等待,我知道这看起来会非常复杂,但请帮助我了解发生了什么。

from functools import partial

class Cage(object):
    def __init__(self, animal):
        self.animal = animal

def gotimes(do_the_petting):
    do_the_petting()

def get_petters():
    for animal in ['cow', 'dog', 'cat']:
        cage = Cage(animal)

        def pet_function():
            print "Mary pets the " + cage.animal + "."

        yield (animal, partial(gotimes, pet_function))

funs = list(get_petters())

for name, f in funs:
    print name + ":", 
    f()

给出:

cow: Mary pets the cat.
dog: Mary pets the cat.
cat: Mary pets the cat.

所以基本上,为什么我没有得到三种不同的动物?不是cage'打包'到嵌套函数的本地范围吗?如果不是,如何调用嵌套函数查找局部变量?

我知道遇到这类问题通常意味着一个人“做错了”,但我想了解会发生什么。

4

4 回答 4

119

嵌套函数在执行时而不是在定义时从父范围查找变量。

编译函数体,验证“自由”变量(未在函数本身中通过赋值定义),然后将其作为闭包单元绑定到函数,代码使用索引来引用每个单元。pet_function因此有一个自由cage变量cageget_petters

当您实际调用该函数时,该闭包将用于查看您调用该函数时cage周围范围内的值。问题就在这里。当你调用你的函数时,函数已经完成了计算它的结果。在执行期间的某个时间点,局部变量被分配了 、 和 字符串中的每一个,但在函数的末尾,包含最后一个值。因此,当您调用每个动态返回的函数时,您会得到打印的值。get_petterscage'cow''dog''cat'cage'cat''cat'

解决方法是不依赖闭包。您可以改用偏函数,创建新的函数作用域,或将变量绑定为关键字参数的默认值

  • 部分函数示例,使用functools.partial()

    from functools import partial
    
    def pet_function(cage=None):
        print "Mary pets the " + cage.animal + "."
    
    yield (animal, partial(gotimes, partial(pet_function, cage=cage)))
    
  • 创建一个新的范围示例:

    def scoped_cage(cage=None):
        def pet_function():
            print "Mary pets the " + cage.animal + "."
        return pet_function
    
    yield (animal, partial(gotimes, scoped_cage(cage)))
    
  • 将变量绑定为关键字参数的默认值:

    def pet_function(cage=cage):
        print "Mary pets the " + cage.animal + "."
    
    yield (animal, partial(gotimes, pet_function))
    

不需要scoped_cage在循环中定义函数,编译只发生一次,而不是在循环的每次迭代中。

于 2012-09-14T11:37:39.570 回答
12

我的理解是,当实际调用产生的 pet_function 时,而不是之前,在父函数命名空间中查找笼子。

所以当你这样做时

funs = list(get_petters())

您生成 3 个函数,它们将找到最后创建的笼子。

如果您将最后一个循环替换为:

for name, f in get_petters():
    print name + ":", 
    f()

你实际上会得到:

cow: Mary pets the cow.
dog: Mary pets the dog.
cat: Mary pets the cat.
于 2012-09-14T11:39:16.727 回答
7

这源于以下

for i in range(2): 
    pass

print(i)  # prints 1

迭代后的值i被懒惰地存储为其最终值。

作为生成器,该函数可以工作(即依次打印每个值),但是当转换为列表时,它会在生成器上运行cage,因此所有对( ) 的调用都会cage.animal返回猫。

于 2012-09-14T11:38:19.917 回答
1

让我们简化问题。定义:

def get_petters():
    for animal in ['cow', 'dog', 'cat']:
        def pet_function():
            return "Mary pets the " + animal + "."

        yield (animal, pet_function)

然后,就像在问题中一样,我们得到:

>>> for name, f in list(get_petters()):
...     print(name + ":", f())

cow: Mary pets the cat.
dog: Mary pets the cat.
cat: Mary pets the cat.

但是,如果我们避免创建list()第一个:

>>> for name, f in get_petters():
...     print(name + ":", f())

cow: Mary pets the cow.
dog: Mary pets the dog.
cat: Mary pets the cat.

这是怎么回事?为什么这种细微的差异会完全改变我们的结果?


如果我们看一下list(get_petters()),从不断变化的内存地址中可以清楚地看出,我们确实产生了三个不同的函数:

>>> list(get_petters())

[('cow', <function get_petters.<locals>.pet_function at 0x7ff2b988d790>),
 ('dog', <function get_petters.<locals>.pet_function at 0x7ff2c18f51f0>),
 ('cat', <function get_petters.<locals>.pet_function at 0x7ff2c14a9f70>)]

但是,看看cell这些函数绑定到的 s:

>>> for _, f in list(get_petters()):
...     print(f(), f.__closure__)

Mary pets the cat. (<cell at 0x7ff2c112a9d0: str object at 0x7ff2c3f437f0>,)
Mary pets the cat. (<cell at 0x7ff2c112a9d0: str object at 0x7ff2c3f437f0>,)
Mary pets the cat. (<cell at 0x7ff2c112a9d0: str object at 0x7ff2c3f437f0>,)

>>> for _, f in get_petters():
...     print(f(), f.__closure__)

Mary pets the cow. (<cell at 0x7ff2b86b5d00: str object at 0x7ff2c1a95670>,)
Mary pets the dog. (<cell at 0x7ff2b86b5d00: str object at 0x7ff2c1a952f0>,)
Mary pets the cat. (<cell at 0x7ff2b86b5d00: str object at 0x7ff2c3f437f0>,)

对于这两个循环,cell对象在整个迭代过程中保持不变。但是,正如预期的那样,str它引用的具体内容在第二个循环中有所不同。cell对象引用,在被调用animal时创建。get_petters()但是,在生成器函数运行animal时会更改str它引用的对象。

在第一个循环中,在每次迭代中,我们创建了所有的fs,但我们只有在生成器get_petters()完全耗尽并且list已经创建了一个函数之后才调用它们。

在第二个循环中,在每次迭代期间,我们暂停get_petters()生成器并在每次暂停后调用f。因此,我们最终检索到animal生成器函数暂停的那一刻的值。

正如@Claudiu 对类似问题的回答:

创建了三个单独的函数,但它们每个都有定义它们的环境的闭包 - 在这种情况下,全局环境(如果循环放置在另一个函数中,则为外部函数的环境)。然而,这正是问题所在——在这种环境中,animal是变异的,并且闭包都引用了相同的animal.

[编者注:i已更改为animal。]

于 2020-01-20T16:02:51.193 回答