2

这个

from __future__ import print_function

from functools import partial
from itertools import imap, product

identity = lambda x: x
identity.__repr__ = 'id'

map_identity = partial(map, identity)
map_identity.__repr__ = 'map'

imap_identity = partial(imap, identity)
imap_identity.__repr__ = 'imap'

prod_map = partial(product, repeat=1)
prod_map.__repr__ = 'prod'



list(map(
    lambda (f, g):
        print(
            "{f_repr:4}(range(10)) compare {g_repr:4}(range(10)):  "\
            "{{ less: {less:1}, equal: {equal:1}}}".format(
                f_repr=f.__repr__,
                g_repr=g.__repr__,
                less=f(range(16))<g(range(16)),
                equal=f(range(16))==g(range(16)),
            )
        ),
    product([identity, map_identity, imap_identity, prod_map], repeat=2)
))

返回

id  (range(10)) compare id  (range(10)):  { less: 0, equal: 1}
id  (range(10)) compare map (range(10)):  { less: 0, equal: 1}
id  (range(10)) compare imap(range(10)):  { less: 0, equal: 0}
id  (range(10)) compare prod(range(10)):  { less: 0, equal: 0}
map (range(10)) compare id  (range(10)):  { less: 0, equal: 1}
map (range(10)) compare map (range(10)):  { less: 0, equal: 1}
map (range(10)) compare imap(range(10)):  { less: 0, equal: 0}
map (range(10)) compare prod(range(10)):  { less: 0, equal: 0}
imap(range(10)) compare id  (range(10)):  { less: 1, equal: 0}
imap(range(10)) compare map (range(10)):  { less: 1, equal: 0}
imap(range(10)) compare imap(range(10)):  { less: 1, equal: 0}
imap(range(10)) compare prod(range(10)):  { less: 1, equal: 0}
prod(range(10)) compare id  (range(10)):  { less: 1, equal: 0}
prod(range(10)) compare map (range(10)):  { less: 1, equal: 0}
prod(range(10)) compare imap(range(10)):  { less: 0, equal: 0}
prod(range(10)) compare prod(range(10)):  { less: 1, equal: 0}

迭代器的原因是什么,imap并且在比较时与列表/prod_map行为不同?idmap

4

2 回答 2

7

这里有几个单独的问题。


首先,map2.x 中的结果不是迭代器而是列表。通过按字典顺序比较它们的元素来比较两个列表。

迭代器和许多其他可迭代对象并非如此(因为这样做会消耗迭代器,使它们无用)。因此,就像 Python 中没有任何其他明显方法来比较它们是否相等的大多数类型一样,大多数迭代器类型(包括生成器,以及来自 的特殊 C 实现的迭代器itertools)比较按id. 碰巧迭代相同序列的两个不同迭代器通常不会相等。

当然,identity如果你传递一个列表,结果也是一个列表。并且range(16)是一个列表。因此,在两个函数都在 中的情况下(id, map),结果将相等;在任一函数位于 的情况下(imap, prod),结果将相等。


其次,<对两种不相关类型的值使用(或其他排序比较)可以为您提供一个在任意运行中一致但任意的顺序。问为什么一个人比另一个人少是没有意义的。它必须是其中之一;不管是哪个。(如果你真的想知道细节,你可以阅读你选择的解释器的源代码。CPython 的实现很简单,也很愚蠢,正如你想象的那样:不相关类型的值有效地按照它们的类型的规范名称排序。 )


那么,如果你知道两个迭代器是否迭代同一个序列呢?

一般来说,你不能。例如chain(0, count(1))count(0)清楚地迭代相同的序列……但你会花费无限的时间来弄清楚这一点。(当然,在这种情况下,有了足够的关于如何工作chaincount访问它们内部的信息,你可以在有限的时间内完成——至少我希望如此,或者你仍在验证段落前面的“清楚”位。但是如果不解决停机问题,您通常无法做到这一点。)

在简单的情况下,您可以只调用list每个列表,比较两个列表(然后使用列表而不是原始的、现在为空的迭代器)。在某些情况下(例如,您可以依赖它们非常早或相等但很小,但如果不同,您不能依赖它们变小),您可以使用tee并且只迭代到第一个区别(然后使用teed 副本而不是原始迭代器),但这基本上是相同的想法。

但实际上,您可能想要的只是这样:

equal_values = (x1 == x2 for x1, x2 in izip(i1, i2))

那么您遇到的问题与您已经知道如何处理的任何其他迭代器完全相同,对吧?例如,如果您确定它们不是无限的,并且您愿意使用迭代器来确定它们是否相等:

equal_sequences = all(equal_values)

Python 3.x 几乎消除了第一个问题,它不鼓励您无缘无故地构建大量中间列表,而是鼓励您将事物保存在迭代器中,直到您需要迭代它们(通常一次,在最后)。特别是,range不返回 a list——尽管它确实返回了与自身比较相等的东西——并map返回一个迭代器。所以,只有当这两个函数都是平等的时候,id你才会得到平等。

Python 3.x 完全消除了第二个问题,只是不允许您比较不相关类型的值。TypeError如果你尝试,你会得到一个。因此,您不能被误导去寻找一个值小于另一个值的不存在的原因。

于 2013-08-01T23:12:06.820 回答
0

我怀疑您没有将相同的事物相互比较,因此我决定手动进行。这就是发生的事情......

>>> import functools
>>> from itertools import imap, product
>>> identity = lambda x: x
>>> map_identity = functools.partial(map, identity)
>>> map_identity(range(16))
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
>>> map_identity(range(16)) == [x for x in range(16)]
True

当然,这是有道理的。

>>> imap_identity = functools.partial(imap, identity)
>>> imap_identity(range(16))
<itertools.imap object at 0x10aeb6f50>

哦哦

>>> imap_identity(range(16)) < identity
False
>>> imap_identity(range(16)) > identity
True

是的,这样就可以了。这实际上在一两天前让我绊倒了。我以为我正在使用函数,但我正在使用生成器。你当然可以这样做:

>>> im = imap_identity(range(16))
>>> [x for x in im]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

imap很棒,但由于它是一个生成器,它只在必要时评估它的序列,你必须要求它明确地给你一些数字。使用您的代码,您最终不会这样做。你可以用你的代码来做到这一点:

less=[x for x in f(range(16))]<[x for x in g(range(16))],
equal=[x for x in f(range(16))]==[x for x in g(range(16))]

使用起来也一样好list()。当然,正如 abarnert 所指出的,您似乎并不是在询问如何让它们相互比较,所以我最后一句可能是徒劳的。

于 2013-08-01T23:29:51.903 回答