11

在 C 中,我有这段代码:

int a;
a = 10 + 5 - 3

我想问:(10+5-3)存储在哪里?(据我所知,a位于堆栈上,怎么样(10+5-3)?这个右值是如何计算的?)

4

7 回答 7

6

通常,r 值“存储”在程序本身中。

换句话说,编译器本身(在程序运行之前)计算 10 + 5 - 3 值(它可以这样做,因为它全部基于常量立即值),并发出汇编代码来存储结果在赋值的任何左值(在这种情况下,名为 a 的变量,编译器可能知道它是一个数据段来源的相对地址)。

因此,值为 12 的 r 值只能在程序的二进制文件中找到,在看起来像这样的汇编指令中

  mov <some dest, typically DS-relative>, $0C 

$0C 是“r 值”。

如果 r 值恰好是只能在运行时完成的计算的结果,假设底层 c 代码是:a = 17 * x; // x 一些运行时变量,r 值也将作为程序二进制文件中的一系列指令“存储”(或更确切地说是物化)。与上面简单的“mov dest, imm”的区别在于,将变量 x 加载到累加器中需要几条指令,乘以 17 并将结果存储在变量 a 所在的地址。编译器可能会“授权自己”;-) 将堆栈用于某些中间结果等,但这将是
a) 完全依赖于编译器
b) 瞬态
c) 并且通常只涉及r 值的一部分
因此可以肯定地说,r 值是一个编译时概念,它被封装在程序的一部分(而不是数据)中,并且不存储在程序二进制文件中的任何地方。

作为对 paxdiablo 的回应:上面提供的解释确实限制了可能性,因为 c 标准实际上并没有规定任何那种性质的东西。尽管如此,大多数任何 r 值最终都会至少部分地通过一些指令实现,这些指令设置了正确的值,无论是计算(在运行时)还是立即得到正确处理。

于 2009-11-03T04:51:59.707 回答
5

常量可能在编译时被简化,所以你提出的问题可能无济于事。但是,比如说,i - j + k确实需要在运行时从一些变量中计算出来的东西,可能会被“存储”在编译器喜欢的任何地方,具体取决于 CPU 架构:编译器通常会尽力使用寄存器,例如

 LOAD AX, i
 SUB AX, j
 ADD AX, k

计算这样的表达式,将其“存储”在累加器寄存器 AX 中,然后将其分配给某个存储位置STORE AX, dest等。如果一个现代优化编译器在一个甚至是半体面的 CPU 架构(是的,包括 x86 !-)上需要将寄存器溢出到内存以实现任何相当简单的表达式,我会感到非常惊讶!

于 2009-11-03T04:58:11.907 回答
1

这取决于编译器。通常值 (12) 将由编译器计算。然后将其存储在代码中,通常作为加载/移动立即汇编指令的一部分。

于 2009-11-03T04:53:30.670 回答
1
  • RHS(右侧)中的计算结果由编译器在称为“恒定传播”的步骤中计算。
  • 然后,它被存储为汇编指令的操作数,将值移动到a

这是 MSVC 的反汇编:

  int a;
  a = 10 + 5 - 3;

0041338E  mov         dword ptr [a],0Ch 
于 2009-11-03T05:02:48.140 回答
1

它存储在哪里实际上完全取决于编译器。该标准没有规定这种行为。

通过实际编译代码并查看汇编器输出可以看到一个典型的地方:

int main (int argc, char *argv[]) {
    int a;
    a = 10 + 5 - 3;
    return 0;
}

产生:

        .file   "qq.c"
        .def    ___main;
            .scl    2;
            .type   32;
        .endef
        .text
.globl _main
        .def    _main;
            .scl    2;
            .type   32;
        .endef
_main:
        pushl   %ebp
        movl    %esp, %ebp
        subl    $8, %esp
        andl    $-16, %esp
        movl    $0, %eax
        addl    $15, %eax
        addl    $15, %eax
        shrl    $4, %eax
        sall    $4, %eax
        movl    %eax, -8(%ebp)
        movl    -8(%ebp), %eax
        call    __alloca
        call    ___main
        movl    $12, -4(%ebp)         ;*****
        movl    $0, %eax
        leave
        ret

标记了相关位;*****,您可以看到该值是由编译器创建的,并且直接插入到mov类型指令中。

请注意,它只是这么简单,因为表达式是一个常量值。一旦引入非常量值(如变量),代码就会变得有点复杂。这是因为您必须在内存中查找这些变量(或者它们可能已经在寄存器中),然后在运行时而不是编译时操作这些值。

至于编译器如何计算值应该是什么,这与表达式评估有关,是另一个问题:-)

于 2009-11-03T05:10:31.977 回答
0

你的问题是基于一个不正确的前提。

C 中左值的定义属性是它在存储中占有一席之地,即它被存储。这就是 lvalue 与rvalue的区别。右值存储在任何地方。这就是使它成为右值的原因。如果它被存储,则根据定义它将是左值

于 2009-11-03T05:39:49.953 回答
0

术语“左值”和“右值”用于平分表达式世界。也就是说,(10+5-3)是一个恰好是右值的表达式(因为您不能将 & 运算符应用于它——在 C++ 中,规则更复杂)。在运行时,没有表达式、左值或右值。特别是,它们不会存储在任何地方。

您想知道值 12 存储在哪里,但值 12 既不是左值也不是右值(与作为12右值但12不会出现在程序中的表达式相反)。

于 2009-11-03T14:41:30.190 回答