18

在 Python (2.7.2) 中,为什么

import dis
dis.dis("i in (2, 3)")

按预期工作而

import dis
dis.dis("i in [2, 3]")

提出:

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.7/dis.py", line 45, in dis
  disassemble_string(x)
File "/usr/lib/python2.7/dis.py", line 112, in disassemble_string
  labels = findlabels(code)
File "/usr/lib/python2.7/dis.py", line 166, in findlabels
 oparg = ord(code[i]) + ord(code[i+1])*256
IndexError: string index out of range

请注意,这不会影响 Python3。

4

3 回答 3

29

简答

在 Python 2.x 中,该str类型保存原始字节,因此dis假设如果您将字符串传递给它,它将获得已编译的字节码。它会尝试反汇编您作为字节码传递的字符串,并且——纯粹是由于 Python 字节码的实现细节——在i in (2,3). 但是,显然,它返回的是乱码。

在 Python 3.x 中,str类型用于字符串bytes类型用于原始字节,因此dis可以区分已编译的字节码和字符串——如果它获取字符串,则假定它正在获取源代码。


长答案

这是我为解决这个问题而遵循的思考过程。

  1. 我在我的 Python (3.2) 上尝试过:

    >>> import dis
    >>> dis.dis("i in (2,3)")  
      1           0 LOAD_NAME                0 (i)
                  3 LOAD_CONST               2 ((2, 3))
                  6 COMPARE_OP               6 (in)
                  9 RETURN_VALUE
    >>> dis.dis("i in [2,3]")
      1           0 LOAD_NAME                0 (i)
                  3 LOAD_CONST               2 ((2, 3))
                  6 COMPARE_OP               6 (in)
                  9 RETURN_VALUE
    

    显然,这行得通。

  2. 我在 Python 2.7 上试过:

    >>> import dis
    >>> dis.dis("i in (2,3)")
              0 BUILD_MAP       26912
              3 JUMP_FORWARD    10272 (to 10278)
              6 DELETE_SLICE+0
              7 <44>
              8 DELETE_SLICE+1
              9 STORE_SLICE+1
    >>> dis.dis("i in [2,3]")
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "C:\Python27\lib\dis.py", line 45, in dis
        disassemble_string(x)
      File "C:\Python27\lib\dis.py", line 112, in disassemble_string
        labels = findlabels(code)
      File "C:\Python27\lib\dis.py", line 166, in findlabels
        oparg = ord(code[i]) + ord(code[i+1])*256
    IndexError: string index out of range
    

    啊哈!另请注意,Python 3.2 中生成的字节码是您所期望的(“加载i、加载(2,3)、测试成员资格、返回结果”),而您在 Python 2.7 中得到的是乱码。显然,dis在 2.7 中将字符串反编译为字节码,但在 3.2 中将其编译为 Python。

  3. 我查看了dis.dis. 以下是关键点:

    蟒蛇 2.7:

    elif isinstance(x, str):
        disassemble_string(x)
    

    蟒蛇 3.2:

       elif isinstance(x, (bytes, bytearray)): # Raw bytecode
           _disassemble_bytes(x)
       elif isinstance(x, str):    # Source code
           _disassemble_str(x)
    

    只是为了好玩,让我们通过dis在 Python 3 中传递相同的字节来检查这一点:

    >>> dis.dis("i in (2,3)".encode())
              0 BUILD_MAP       26912
              3 JUMP_FORWARD    10272 (to 10278)
              6 <50>
              7 <44>
              8 <51>
              9 <41>
    

    啊哈!胡言乱语!(但请注意,它的胡言乱语略有不同——字节码已随 Python 版本而改变!)

于 2012-05-06T20:39:00.140 回答
18

dis.dis期望字节码作为参数,而不是 python 源代码。尽管您的第一个示例“有效”,但它没有提供任何有意义的输出。你可能想要:

import compiler, dis

code = compiler.compile("i in [2, 3]", '', 'single')
dis.dis(code)

这按预期工作。(我只在 2.7 中测试过)。

于 2012-05-06T20:21:29.370 回答
9

如果您只是想获取简单表达式的字节码,将其作为 lambda 传递给 dis 并将您的表达式作为 lambda 的主体是最简单的:

>>> import dis
>>> dis.dis(lambda i : i in [3,2])
  1           0 LOAD_FAST                0 (i)
              3 LOAD_CONST               2 ((3, 2))
              6 COMPARE_OP               6 (in)
              9 RETURN_VALUE
于 2012-05-06T21:03:23.587 回答