14

Q1 - 以下是set()agenerator expression还是 a set comprehension?(或者它们是否相同?如果是,list&dict理解是否也对应于生成器上的类型转换?)

my_set = {x for x in range(10)}

Q2 - 评估是否考虑重复值然后通过应用删除它们set()

dup_set = {x for x in [0, 1, 2, 0, 1, 2]}

理解执行(速度方面)是否比常规for循环更好?

更新- 我尝试使用timeit速度比较。我不确定我是否只是(公平)。

C:\>python -m timeit "s = set()" "for x in range(10):" "
  s.add(x)"
100000 loops, best of 3: 2.3 usec per loop

C:\>python -m timeit "s = {x for x in range(10)}"
1000000 loops, best of 3: 1.68 usec per loop

现在,使用一些条件

C:\>python -m timeit "s = set()" "for x in range(10):" "
  if x%2: s.add(x)"
100000 loops, best of 3: 2.27 usec per loop

C:\>python -m timeit "s = {x for x in range(10) if x%2}"
1000000 loops, best of 3: 1.83 usec per loop

所以,有很大的不同,是因为功能被硬编码c吗?

4

1 回答 1

7

Q1:是的,是的,是的,是的。或者至少他们的行为是这样的。如果您查看字节码,情况会有所不同。让我们反汇编这段代码(Python 2.7):

def list_comp(l):
    return [x+1 for x in l]

def dict_comp(l):
    return {x+1:0 for x in l}

def set_comp(l):
    return {x+1 for x in l}

def generator(l):
    return (x+1 for x in l)

这就是你得到的:

Disassembly of list_comp:
  2           0 BUILD_LIST              0
              3 LOAD_FAST               0 (l)
              6 GET_ITER            
        >>    7 FOR_ITER               16 (to 26)
             10 STORE_FAST              1 (x)
             13 LOAD_FAST               1 (x)
             16 LOAD_CONST              1 (1)
             19 BINARY_ADD          
             20 LIST_APPEND             2
             23 JUMP_ABSOLUTE           7
        >>   26 RETURN_VALUE
Disassembly of dict_comp:
  5           0 LOAD_CONST              1 (<code object <dictcomp> at 029DEE30)
              3 MAKE_FUNCTION           0
              6 LOAD_FAST               0 (l)
              9 GET_ITER            
             10 CALL_FUNCTION           1
             13 RETURN_VALUE  
Disassembly of set_comp:
  8           0 LOAD_CONST              1 (<code object <setcomp> at 029DECC8)
              3 MAKE_FUNCTION           0
              6 LOAD_FAST               0 (l)
              9 GET_ITER            
             10 CALL_FUNCTION           1
             13 RETURN_VALUE  
Disassembly of generator:
 11           0 LOAD_CONST              1 (<code object <genexpr> at 02A8FD58)
              3 MAKE_FUNCTION           0
              6 LOAD_FAST               0 (l)
              9 GET_ITER            
             10 CALL_FUNCTION           1
             13 RETURN_VALUE                     

字典理解、集合理解和生成器的字节码几乎不一样。它们都加载一个代码对象(<dictcomp>,<setcomp><genexpr>),然后从中创建一个可调用函数。列表推导是不同的,因为它生成与您的列表推导相对应的字节码。这次它被解释了,因此不是原生的。

Q2:它并没有真正考虑重复值,因为它使用您提供的列表创建了一个理解。然后它用理解创建集合。

关于时间:列表/字典/集合理解往往比其他任何东西都快。即使它们被解释,生成的字节码也会针对大多数特殊字节码指令(如SET_ADD,LIST_APPENDMAP_ADD.

于 2013-12-10T14:29:16.570 回答