我想了解更多关于汇编的知识并写了一个小例子:
#include <stdio.h>
#include <math.h>
void f() {
unsigned char i[4];
i[0] = 5;
i[1] = 6;
i[2] = 7;
i[3] = 8;
int j = 0;
for(j=0; j < 20; j++)
printf("%02X\n", i[j]);
}
int main() {
int i[5];
i[0] = 3;
i[1] = 3;
i[2] = 3;
i[3] = 3;
i[4] = 3;
f();
return 0;
}
我的目标是查看指令指针的实际返回地址,当它启动 f() 时,它由 main() 中的 callq 调用确定。
我使用 gdb 反汇编 main() 并得到以下内容
Dump of assembler code for function main:
0x0000000100000eb0 <main+0>: push %rbp
0x0000000100000eb1 <main+1>: mov %rsp,%rbp
0x0000000100000eb4 <main+4>: sub $0x20,%rsp
0x0000000100000eb8 <main+8>: movl $0x3,-0x1c(%rbp)
0x0000000100000ebf <main+15>: movl $0x3,-0x18(%rbp)
0x0000000100000ec6 <main+22>: movl $0x3,-0x14(%rbp)
0x0000000100000ecd <main+29>: movl $0x3,-0x10(%rbp)
0x0000000100000ed4 <main+36>: movl $0x3,-0xc(%rbp)
0x0000000100000edb <main+43>: callq 0x100000e40 <f>
0x0000000100000ee0 <main+48>: movl $0x0,-0x8(%rbp)
0x0000000100000ee7 <main+55>: mov -0x8(%rbp),%eax
0x0000000100000eea <main+58>: mov %eax,-0x4(%rbp)
0x0000000100000eed <main+61>: mov -0x4(%rbp),%eax
0x0000000100000ef0 <main+64>: add $0x20,%rsp
0x0000000100000ef4 <main+68>: pop %rbp
0x0000000100000ef5 <main+69>: retq
所以我期待找到规定的指令指针返回地址为0x0000000100000ee0,因为这是callq之后的下一条指令。当我运行我的程序时,我得到(我将它们分成 4 组,以便您更好地阅读它们):
05
06
07
08
40
1B
08
56
FF
7F
00
00
E0
EE
B7
09
01
00
00
00
00
00
00
00
03
00
00
00
03
00
00
00
03
00
00
00
03
00
00
00
好的,所以我可以看到我在 f() 中写入局部变量的 5,6,7,8 并且可以看到 main() 的局部变量那些 4 字节整数,它们已设置为 3。之后5,6,7,8(这是一个 64 位系统)我希望接下来的 8 个字节编码 %rbp 寄存器的先前值,然后接下来的 8 个字节包含指令指针的返回地址。所以返回地址应该是
E0
EE
B7
09
01
00
00
00
现在,当我将它与我期望从 gdb 得到的 0x0000000100000ee0 进行比较时,我可以在最后 4 个字节中看到 00000001,并且我可以在第一个字节中看到来自 00000ee0 的 e0。但是为什么我没有得到我所期望的呢?我考虑过字节顺序(我相信 Mac OS X 是小端),但这并不能解释我在这里看到的内容,从我的理解来看。
欢迎任何意见,
谢谢你们,
克里斯托夫