7

假设我有这三个列表:

a = [1, 2, 3, 4]
b = [5, 6, 7, 8, 9]
c = [10, 11, 12]

是否有这样的内置函数:

somezip(a, b) == [(1, 5), (2, 6), (3, 7), (4, 8)]
somezip(a, c) == [(1, 10), (2, 11), (3, 12), (4, None)]

行为介于zip和之间zip_longest

4

5 回答 5

9

不,没有,但是您可以轻松地结合takewhileizip_longest的功能来实现您想要的

from itertools import takewhile, izip_longest
from operator import itemgetter
somezip = lambda *p: list(takewhile(itemgetter(0),izip_longest(*p)))

(如果第一个迭代器可能有评估为 False 的项目,您可以将 itemgetter 替换为 lambda 表达式 - 请参阅 @ovgolovin 的评论)

somezip = lambda *p: list(takewhile(lambda e: not e[0] is None,izip_longest(*p)))

例子

>>> from itertools import takewhile, izip_longest
>>> from operator import itemgetter
>>> a = [1, 2, 3, 4]
>>> b = [5, 6, 7, 8, 9]
>>> c = [10, 11, 12]
>>> somezip(a,b)
[(1, 5), (2, 6), (3, 7), (4, 8)]
>>> somezip(a,c)
[(1, 10), (2, 11), (3, 12), (4, None)]
>>> somezip(b,c)
[(5, 10), (6, 11), (7, 12), (8, None), (9, None)]
于 2012-11-12T09:40:50.333 回答
5
import itertools as it

somezip = lambda *x: it.islice(it.izip_longest(*x), len(x[0]))



>>> list(somezip(a,b))
[(1, 5), (2, 6), (3, 7), (4, 8)]

>>> list(somezip(a,c))
[(1, 10), (2, 11), (3, 12), (4, None)]
于 2012-11-12T09:37:22.510 回答
3

您的输出似乎受到第一个迭代器的输出的限制it1。所以我们可以it1按原样使用,并it2用无限产生的None迭代器和zip它们填充。

>>> from itertools import repeat,izip,chain
>>> somezip = lambda it1,it2: izip(it1,chain(it2,repeat(None)))

>>> list(somezip(a,b))
[(1, 5), (2, 6), (3, 7), (4, 8)]
>>> list(somezip(a,c))
[(1, 10), (2, 11), (3, 12), (4, None)]

repeat(None)None创建无限产生的迭代器。

chain胶水it2repeat(None)

izip一旦it1用尽就会停止屈服。

其他解决方案有一些缺陷(我在评论中留下了评论)。它们可能运行良好,但有一些输入可能会意外失败。


正如glglgl在评论中建议的那样,这个函数宁愿接受参数中可变数量的迭代器。

所以我更新了代码来工作:

from itertools import repeat,izip,chain,imap
somezip = lambda it1,*its: izip(it1,*imap(chain,its,repeat(repeat(None))))

测试:

>>> print(list(somezip(a,b)))
    print(list(somezip(a,c)))
    print(list(somezip(b,a,c)))

[(1, 5), (2, 6), (3, 7), (4, 8)]
[(1, 10), (2, 11), (3, 12), (4, None)]
[(5, 1, 10), (6, 2, 11), (7, 3, 12), (8, 4, None), (9, None, None)]

imap尽管没有必要这样做,但我不得不在这里使用(因为参数稍后会被解包,所以很简单map)。原因是map 不接受不同长度的迭代器imap,而在消耗最小的迭代器时停止。

因此,imap适用chain于除第一个迭代器和chains之外的所有迭代器repeat(None)。为its我在repeat上面使用的每个迭代器提供服务repeat(None)(注意,这在其他项目中可能非常危险,因为外部repeat生成的所有对象都是同一个对象repeat(None),所以最后它们所有的chain编辑迭代器共享它)。然后我解压缩imap对象以生成参数到izip,它返回值直到it1被消耗(因为chainedits现在每个生成无限的值序列)。

请注意,所有操作都在纯 C 中工作,因此不涉及解释器开销。

为了阐明它的工作原理,我添加了以下详细说明:

def somezip(it1,*its): #from 0 to infinite iterators its
    # it1 -> a1,a2,a3,...,an
    # its -> (b1,b2,b3,...,bn),(c1,c2,c3,...,cn),...
    infinite_None = repeat(None) # None,None,None,...
    infinite_Nones = repeat(infinite_None) # infinite_None,infinite_None,... (share the same infinite_None)
    chained = imap(chain,its,infinite_Nones) # [(b1,b2,b3,...,bn,None,None,...),(c1,c2,c3,...,cn,None,None,...),...]
    return izip(it1,*chained)

单线就是:

somezip = lambda it1,*its: izip(it1,*imap(chain,its,repeat(repeat(None))))
于 2012-11-12T10:04:09.397 回答
0

定义自己的功能:

In [64]: def myzip(*args):
    lenn=len(args[0])
    return list(izip_longest(*[islice(x,lenn) for x in args],fillvalue=None))
   ....: 

In [30]: myzip(a,b)
Out[30]: [(1, 5), (2, 6), (3, 7), (4, 8)]

In [31]: myzip(b,c)
Out[31]: [(5, 10), (6, 11), (7, 12), (8, None), (9, None)]

In [32]: myzip(a,c)
Out[32]: [(1, 10), (2, 11), (3, 12), (4, None)]
于 2012-11-12T09:43:08.463 回答
0

这比其他的要长,但相对容易理解,如果这很重要的话。;-)

a = [1, 2, 3, 4]
b = [5, 6, 7, 8, 9]
c = [10, 11, 12]
def g(n): return xrange(n)  # simple generator

def my_iter(iterable, fillvalue=None):
    for i in iterable: yield i
    while True: yield fillvalue

def somezip(*iterables, **kwds):
    fillvalue = kwds.get('fillvalue')
    iters = [my_iter(i, fillvalue) for i in iterables]
    return [tuple(next(it) for it in iters) for i in iterables[0]]

print 'somezip(a, b):', somezip(a, b)
print 'somezip(a, c):', somezip(a, c)
print 'somezip(a, g(2)):', somezip(a, g(2))
print 'somezip(g(2), a):', somezip(g(2),a)
print 'somezip(a, b, c):', somezip(a, b, c)
print 'somezip(a, b, c, g(2)):', somezip(a, b, c, g(2))
print 'somezip(g(2), a, b, c):', somezip(g(2), a, b, c)

输出:

somezip(a, b): [(1, 5), (2, 6), (3, 7), (4, 8)]
somezip(a, c): [(1, 10), (2, 11), (3, 12), (4, None)]
somezip(a, g(2)): [(1, 0), (2, 1), (3, None), (4, None)]
somezip(g(2), a): [(1, 1)]
somezip(a, b, c): [(1, 5, 10), (2, 6, 11), (3, 7, 12), (4, 8, None)]
somezip(a, b, c, g(2)): [(1, 5, 10, 0), (2, 6, 11, 1), (3, 7, 12, None), (4, 8, None, None)]
somezip(g(2), a, b, c): [(1, 1, 5, 10)]
于 2012-11-12T10:41:59.240 回答