40

为什么在示例函数中终止:

def func(iterable):
    while True:
        val = next(iterable)
        yield val

但是如果我取消yield语句函数会引发StopIteration异常吗?

编辑:很抱歉误导了你们。我知道生成器是什么以及如何使用它们。当然,当我说函数终止时,我并不是指急切地评估函数。我只是暗示当我使用函数生成生成器时:

gen = func(iterable)

func的情况下,它可以工作并返回相同的生成器,但在 func2 的情况下:

def func2(iterable):
    while True:
        val = next(iterable)

它引发 StopIteration 而不是None返回或无限循环。

让我更具体一点。在itertools中有一个函数tee相当于:

def tee(iterable, n=2):
    it = iter(iterable)
    deques = [collections.deque() for i in range(n)]
    def gen(mydeque):
        while True:
            if not mydeque:             # when the local deque is empty
                newval = next(it)       # fetch a new value and
                for d in deques:        # load it to all the deques
                    d.append(newval)
            yield mydeque.popleft()
    return tuple(gen(d) for d in deques)

事实上,有一些魔法,因为嵌套函数gen有无限循环,没有 break 语句。gen函数在没有项目时由于StopIteration异常而终止。但它正确终止(不引发异常),即只是停止循环。所以问题是StopIteration在哪里处理?

4

5 回答 5

63

注意:这个问题(以及我对它的回答的原始部分)只对 3.7 之前的 Python 版本真正有意义。由于PEP 479中描述的更改,所询问的行为在 3.7 及更高版本中不再发生。因此,这个问题和原始答案仅作为历史文物才真正有用。在 PEP 被接受后,我在答案的底部添加了一个与现代版本的 Python 更相关的附加部分。


要回答您关于在内部创建的生成器StopIteration中捕获的位置的问题:它没有。由结果的消费者在迭代时捕获异常。genitertools.teetee

首先,重要的是要注意生成器函数(它是在任何地方都有yield语句的任何函数)与普通函数根本不同。而不是在调用函数时运行该函数的代码,而是generator在调用该函数时获得一个对象。只有当您迭代生成器时,您才会运行代码。

生成器函数在不引发的情况下永远不会完成迭代StopIteration(除非它引发其他异常)。StopIteration是来自生成器的信号,表明它已经完成,它不是可选的。如果你return在没有引发任何东西的情况下到达一个语句或生成器函数代码的结尾,Python 会StopIteration为你引发!

这与常规函数不同,常规函数None在到达末尾时返回而不返回任何其他内容。如上所述,它与生成器的不同工作方式有关。

这是一个示例生成器函数,可以很容易地看到如何StopIteration引发:

def simple_generator():
    yield "foo"
    yield "bar"
    # StopIteration will be raised here automatically

这是您食用它时会发生的情况:

>>> g = simple_generator()
>>> next(g)
'foo'
>>> next(g)
'bar'
>>> next(g)
Traceback (most recent call last):
  File "<pyshell#6>", line 1, in <module>
    next(g)
StopIteration

调用simple_generator总是generator立即返回一个对象(不运行函数中的任何代码)。对生成器对象的每次调用next都会运行代码直到下一条yield语句,并返回产生的值。如果没有更多可以得到,StopIteration则被提出。

现在,通常您不会看到StopIteration异常。这样做的原因是您通常在for循环中使用生成器。语句将for自动next一遍又一遍地调用,直到StopIteration被提出。它会为你捕获并抑制StopIteration异常,所以你不需要弄乱try/except块来处理它。

for像这样的循环for item in iterable: do_suff(item)几乎完全等同于这个while循环(唯一的区别是 realfor不需要临时变量来保存迭代器):

iterator = iter(iterable)
try:
    while True:
        item = next(iterator)
        do_stuff(item)
except StopIteration:
    pass
finally:
    del iterator

gen您在顶部显示的生成器函数是一个例外。它使用StopIteration它所消耗的迭代器产生的异常作为它自己的信号,表明它已经完成了迭代。也就是说,它不是捕获StopIteration然后跳出循环,而是简单地让异常未被捕获(可能被一些更高级别的代码捕获)。

与主要问题无关,我想指出另一件事。在您的代码中,您正在调用next一个名为iterable. 如果您将该名称作为您将获得的对象类型的文档,这不一定是安全的。

nextiterator协议的一部分,而不是iterable(或container)协议。它可能适用于某些类型的可迭代对象(例如文件和生成器,因为这些类型是它们自己的迭代器),但对于其他可迭代对象(例如元组和列表)将失败。更正确的方法是调用iter你的iterable值,然后调用next你收到的迭代器。(或者只是使用for循环,它会在适当的时候为你调用iter和调用!)next


我刚刚在 Google 搜索相关问题时找到了自己的答案,我觉得我应该更新以指出上述答案在现代 Python 版本中并不正确。

PEP 479将允许 aStopIteration从生成器函数中冒泡而不被捕获是错误的。如果发生这种情况,Python 会将其变为RuntimeError异常。这意味着需要修改像旧版本中itertools使用 aStopIteration来突破生成器函数的示例的代码。通常你需要用try/except然后捕获异常return

因为这是一个向后不兼容的变化,所以它逐渐被分阶段实施。在 Python 3.5 中,默认情况下所有代码都像以前一样工作,但您可以使用from __future__ import generator_stop. 在 Python 3.6 中,未修改的代码仍然可以工作,但会发出警告。在 Python 3.7 及更高版本中,新行为始终适用。

于 2013-05-09T23:47:37.577 回答
9

当一个函数 containsyield时,调用它实际上并没有执行任何操作,它只是创建了一个生成器对象。只有迭代这个对象才会执行代码。所以我的猜测是你只是在调用函数,这意味着函数不会引发StopIteration,因为它永远不会被执行。

给定您的功能和可迭代的:

def func(iterable):
    while True:
        val = next(iterable)
        yield val

iterable = iter([1, 2, 3])

这是错误的称呼方式:

func(iterable)

这是正确的方法:

for item in func(iterable):
    # do something with item

您还可以将生成器存储在变量中并调用next()它(或以其他方式对其进行迭代):

gen = func(iterable)
print(next(gen))   # prints 1
print(next(gen))   # prints 2
print(next(gen))   # prints 3
print(next(gen))   # StopIteration

顺便说一句,编写函数的更好方法如下:

def func(iterable):
    for item in iterable:
        yield item

或者在 Python 3.3 及更高版本中:

def func(iterable):
    yield from iter(iterable)

当然,真正的生成器很少如此微不足道。:-)

于 2013-05-09T15:24:24.510 回答
5

如果没有yield,您将遍历整个iterable而不停止对val. while循环不会捕获StopIteration异常。一个等效的for循环是:

def func(iterable):
    for val in iterable:
        pass

它确实捕获StopIteration并简单地退出循环,从而从函数返回。

您可以显式捕获异常:

def func(iterable):
    while True:
        try:
            val = next(iterable)
        except StopIteration:
            break
于 2013-05-09T15:23:23.950 回答
1

yield没有抓住StopIteration. 对您的函数有什么yield作用是使其成为生成器函数而不是常规函数。因此,从函数调用返回的对象是一个可迭代对象(当您使用函数请求它时,它会计算下一个值next(由 for 循环隐式调用))。如果您将yield语句排除在外,那么 python 会while立即执行整个循环,最终会耗尽可迭代对象(如果它是有限的)并StopIteration在您调用它时立即提升。

考虑:

x = func(x for x in [])
next(x)  #raises StopIteration

for循环捕获异常——这就是它知道何时停止调用next你给它的可迭代对象的方式。

于 2013-05-09T15:28:22.243 回答
1

在 Python 3.8 上测试,块作为惰性生成器

def split_to_chunk(size: int, iterable: Iterable) -> Iterable[Iterable]:
    source_iter = iter(iterable)
    while True:
        batch_iter = itertools.islice(source_iter, size)
        try:
            yield itertools.chain([next(batch_iter)], batch_iter)
        except StopIteration:
            return

为什么要处理 StopInteration 错误:https ://www.python.org/dev/peps/pep-0479/

def sample_gen() -> Iterable[int]:
    i = 0
    while True:
        yield i
        i += 1

for chunk in split_to_chunk(7, sample_gen()):
    pprint.pprint(list(chunk))
    time.sleep(2)

输出:

[0, 1, 2, 3, 4, 5, 6]
[7, 8, 9, 10, 11, 12, 13]
[14, 15, 16, 17, 18, 19, 20]
[21, 22, 23, 24, 25, 26, 27]
............................
于 2020-05-17T15:03:26.243 回答