1

我正在尝试解码指令,目前在 80x86 16 位机器上,我在解码没有立即值作为源操作数的指令时没有很多问题,当源操作数不再是寄存器或位置内存,但立即值。下面的指令我会这样解码:

mov ax, 3

101110|11| |11|000|000| 00000011 -> 3 with sign expansion
      |       |   |  register AX
      s = 1   |  null
      w = 1   |
              the second operand is a register

相反,这是不公平的。这是正确的解码:

mov ax, 3

10111000 00000011 0000000

假设源操作数是立即值,有人可以向我解释解码是如何工作的吗?

4

1 回答 1

4

x86 的解码通过查阅表格来工作。

操作码

如果给你一个你已经知道它是指令操作码(而不是指令前缀)的字节,并且该字节将保存值 B8h (10111000b),你会在它所代表的表中看到mov ax, imm16

opcode       immediate
-----------  --------------------
1011_1_000b, 00000011b, 00000000b
     ^  ^
     |  AX
     w-bit

在您的第一个片段中,您尝试剖析 BBh (10111011b) 操作码,但如果您查阅相同的表,您会看到它代表mov bx, imm16.

opcode       immediate
-----------  --------------------
1011_1_011b, 00000011b, 00000000b
     ^  ^
     |  BX
     w-bit

但是,还有第二种方法可以mov ax, imm16使用 modr/m 字节对指令进行编码,就像您在第一个代码段中尝试的那样:

opcode      modr/m       immediate
----------  -----------  --------------------
1100011_1b, 11_000_000b, 00000011b, 00000000b
        ^   ^   ^   ^
        |   |   |   r/m is AX
        |   |   000
        |   mod=11b => r/m is register
        w-bit

此操作码没有 s 位;没有可用的符号扩展。因此,关心代码大小的汇编程序很少使用这种编码。

ADD, ADC, SUB, SBB, CMP, AND, OR, XOR, 和TEST指令存在一对类似的编码。但是对于这些简短形式,没有 modr/m 字节的形式,仅适用于AX寄存器。

您可以在https://software.intel.com/content/www/us/en/develop/articles/intel-sdm.html的英特尔手册中找到您需要的所有表格

于 2021-07-29T21:12:39.743 回答