-1

我正在逐步浏览一个包含 3 行长记录的文本文件。如果在第一行中,我可以说“这是一条我不想计算的记录”,我想移动到下一条记录的开头,再往下 2 行。目前,我正在运行这样的代码片段:

lines = content.split("\n")
iterable = iter(xrange(len(lines)))
for i in iterable:
    line = lines[i]
...
    if isRecord(keyword) == False:
        [iterable.next() for x in range(2)]

在文件的最后,我的理解有可能会抛出一个 stopIteration 错误。如何添加到我的代码中,以便如果我提出一个 stopIteration,它将打破 for 循环?我查看了列表推导中的许多条目,以及如何构建 for 循环以根据 stopIteration 标志停止,但我还不明白如何将其应用于我自己的代码。我还看到了带有 if/else/for 样式的列表推导,但是我可以构建一个具有如下样式的列表推导:

[iterable.next() for x in range(2) else break]

感谢大家的帮助,真心的。

4

2 回答 2

3

您可以使用 切片itertoolssome_list长度为 2、1 或 0,具体取决于列表的剩余量。如果列表更大,将从迭代器中删除 2 个项目,for 循环将继续下一个项目。

import itertools

lines = content.split("\n")
iterable = iter(xrange(len(lines)))
for i in iterable:
    line = lines[i]
...
    if isRecord(keyword) == False:
        some_list = list(itertools.islice(iterable, 2))
于 2017-01-31T17:39:37.187 回答
0

您还可以以一次获得 3 个项目的方式构建您的迭代,例如使用itertools 模块中的这个配方

from itertools import izip_longest

def grouper(iterable, n, fillvalue=None):
    "Collect data into fixed-length chunks or blocks"
    # grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx"
    args = [iter(iterable)] * n
    return izip_longest(*args, fillvalue=fillvalue)

例如

>>> for x in grouper(xrange(10),3):
        print x


(0, 1, 2)
(3, 4, 5)
(6, 7, 8)
(9, None, None)
>>> 

所以对于你的情况,你可以这样做

lines = content.split("\n")
for line,x,y in grouper(lines,3):
    ...
    if not isRecord(keyword) :
        continue # go to the next iteration

或者如果内容不是纯 3 行块中的格式,则使用配方

from itertools import islice
import collections 

def consume(iterator, n):
    "Advance the iterator n-steps ahead. If n is none, consume entirely."
    # Use functions that consume iterators at C speed.
    if n is None:
        # feed the entire iterator into a zero-length deque
        collections.deque(iterator, maxlen=0)
    else:
        # advance to the empty slice starting at position n
        next(islice(iterator, n, n), None)

例子

>>> it=iter(xrange(10))
>>> consume(it,5)
>>> list(it)
[5, 6, 7, 8, 9]
>>> 

如果你真的需要,你也可以enumerate用来知道你是谁,例如

lines = content.split("\n")
iterator = iter(enumerate(lines))
for i,line in iterator:
    ...
    if not isRecord(keyword) :
        consume(iterator,2)
于 2017-01-31T18:26:43.647 回答