9

我有以下程序。我想知道为什么它在下面的 64 位机器上输出 -4?我的哪个假设出错了?

[Linux ubuntu 3.2.0-23-generic #36-Ubuntu SMP Tue Apr 10 20:39:51 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux]

  1. 在上面的机器和 gcc 编译器中,默认情况下应该先推送 b,然后再推送。堆栈向下增长。所以 b 应该有更高的地址,而 a 应该有更低的地址。所以结果应该是积极的。但我得到-4。有人可以解释一下吗?

  2. 参数是占用堆栈帧中 2 个字节的两个字符。但是我看到差异为 4,而我期望为 1。即使有人说这是因为对齐,那么我想知道具有 2 个字符的结构在 4 个字节处未对齐。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

void CompareAddress(char a, char b)
{
    printf("Differs=%ld\n", (intptr_t )&b - (intptr_t )&a);
}

int main()
{
    CompareAddress('a','b');
    return 0; 
}

/* Differs= -4 */
4

3 回答 3

9

这是我的猜测:

在 x64 的 Linux 上,调用约定规定前几个参数通过寄存器传递。

因此,在您的情况下,两者ab都通过寄存器而不是堆栈传递。但是,由于您获取了它的地址,因此编译器将在调用函数后将其存储在堆栈中的某个位置。
(在向下的顺序中不需要。)

该函数也有可能是完全内联的。

在任何一种情况下,编译器都会创建临时堆栈空间来存储变量。这些可以按任何顺序排列并进行优化。因此,它们可能不是您所期望的任何特定顺序。

于 2012-06-16T03:07:20.353 回答
5

回答这类问题(关于特定平台上特定编译器的行为)的最佳方法是查看汇编程序。你可以gcc通过传递-S标志来转储它的汇编程序(-fverbose-asm标志也很好)。跑步

gcc -S -fverbose-asm file.c

给出一个file.s看起来有点像(我已经删除了所有不相关的位,括号中的位是我的笔记):

CompareAddress:
        # ("allocate" memory on the stack for local variables)
        subq    $16, %rsp       
        # (put a and b onto the stack)
        movl    %edi, %edx      # a, tmp62
        movl    %esi, %eax      # b, tmp63
        movb    %dl, -4(%rbp)   # tmp62, a
        movb    %al, -8(%rbp)   # tmp63, b 
        # (get their addresses)
        leaq    -8(%rbp), %rdx  #, b.0
        leaq    -4(%rbp), %rax  #, a.1
        subq    %rax, %rdx      # a.1, D.4597 (&b - &a)
        # (set up the parameters for the printf call)
        movl    $.LC0, %eax     #, D.4598
        movq    %rdx, %rsi      # D.4597,
        movq    %rax, %rdi      # D.4598,
        movl    $0, %eax        #,
        call    printf  #

main:
        # (put 'a' and 'b' into the registers for the function call)
        movl    $98, %esi       #,
        movl    $97, %edi       #,
        call    CompareAddress

这个问题很好地解释了什么[re]bp[re]sp是。)

差异为负的原因是堆栈向下增长:即,如果您将两个东西压入堆栈,则您首先压入的一个将具有更大的地址,并且a在之前被压入b

原因是编译器决定将参数与 4 字节边界对齐是“更好的”,这可能是因为 32 位/64 位 CPU 一次处理 4 个字节比处理单个字节要好-4-1

(此外,查看汇编程序显示了它的效果-mpreferred-stack-boundary:它本质上意味着堆栈上的内存被分配在不同大小的块中。)

于 2012-06-16T03:40:50.257 回答
0

我认为程序给你的答案是正确的,GCC的默认preferred-stack-boundary是4,你可以设置-mpreferred-stack-boundary=numGCC选项来改变堆栈边界,然后程序会根据你的设置给你不同的答案。

于 2012-06-16T03:28:57.297 回答