21

我在这里读过,如果编译器memset知道传递的内存缓冲区不再使用,它​​可以自由地删除调用。这怎么可能?在我看来(从核心语言的角度来看)memset只是一个常规函数,编译器无权假设它内部发生的任何事情都没有副作用。

链接的文章中,他们展示了 Visual C++ 10 如何删除memset. 我知道 Microsoft 编译器在标准合规性方面并不领先,所以我问 - 是根据标准,还是只是 msvc-ism?如果符合标准,请详细说明;)

编辑: @Cubbi

以下代码:

void testIt(){
    char foo[1234];
    for (int i=0; i<1233; i++){
        foo[i] = rand()%('Z'-'A'+1)+'A';
    }
    foo[1233]=0;
    printf(foo);
    memset(foo, 0, 1234);
}

在 mingw 下编译,行:

g++ -c -O2 -frtti -fexceptions -mthreads -Wall -DUNICODE -o main.o main.cpp
g++ -Wl,-s -Wl,-subsystem,console -mthreads -o main.exe main.o
objdump -d -M intel -S main.exe > dump.asm

给出输出:

 4013b0:    55                      push   ebp
 4013b1:    89 e5                   mov    ebp,esp
 4013b3:    57                      push   edi
 4013b4:    56                      push   esi
 4013b5:    53                      push   ebx
 4013b6:    81 ec fc 04 00 00       sub    esp,0x4fc
 4013bc:    31 db                   xor    ebx,ebx
 4013be:    8d b5 16 fb ff ff       lea    esi,[ebp-0x4ea]
 4013c4:    bf 1a 00 00 00          mov    edi,0x1a
 4013c9:    8d 76 00                lea    esi,[esi+0x0]
 4013cc:    e8 6f 02 00 00          call   0x401640
 4013d1:    99                      cdq    
 4013d2:    f7 ff                   idiv   edi
 4013d4:    83 c2 41                add    edx,0x41
 4013d7:    88 14 1e                mov    BYTE PTR [esi+ebx*1],dl
 4013da:    43                      inc    ebx
 4013db:    81 fb d1 04 00 00       cmp    ebx,0x4d1
 4013e1:    75 e9                   jne    0x4013cc
 4013e3:    c6 45 e7 00             mov    BYTE PTR [ebp-0x19],0x0
 4013e7:    89 34 24                mov    DWORD PTR [esp],esi
 4013ea:    e8 59 02 00 00          call   0x401648
 4013ef:    81 c4 fc 04 00 00       add    esp,0x4fc
 4013f5:    5b                      pop    ebx
 4013f6:    5e                      pop    esi
 4013f7:    5f                      pop    edi
 4013f8:    c9                      leave  
 4013f9:    c3                      ret   

在 4013ea 行有 memset 调用,所以 mingw 没有删除它。由于 mingw 在 Windows 皮肤中确实是 GCC,我想 GCC 也是这样做的——我会在重新启动到 linux 时检查它。

仍然无法找到这样的编译器?

编辑2:

我刚刚发现了 GCC 的__attribute__ ((pure)). 所以并不是编译器知道 memset 的一些特殊之处并忽略它,只是它的标题中允许使用它 - 使用它的程序员也应该看到它;)我的 mingw 在memset声明中没有这个属性,因此它没有从无论如何组装 - 正如我所期望的那样。我将不得不对此进行调查。

4

1 回答 1

12

“编译器无权假设它内部发生的任何事情都没有副作用。”

这是正确的。但是如果编译器实际上知道它内部实际发生了什么并且可以确定它确实没有副作用,那么就不需要假设了。

这就是几乎所有编译器优化的工作方式。代码显示“X”。编译器确定如果“Y”为真,那么它可以将代码“X”替换为代码“Z”并且不会有可检测的差异。它确定“Y”为真,然后将“X”替换为“Z”。

例如:

void func()
{
  int j = 2;
  foo();
  if (j == 2) bar();
   else baz();
}

编译器可以将其优化为foo(); bar();. 编译器可以看到foo不能合法地修改j. 如果foo()以某种方式神奇地找出j堆栈上的位置并对其进行修改,那么优化将改变代码的行为,但这是程序员使用“魔术”的错。

void func()
{
  int j = 2;
  foo(&j);
  if (j == 2) bar();
   else baz();
}

现在它不能因为foo可以合法地修改j没有任何魔法的值。(假设编译器无法查看内部foo,在某些情况下可以。)

如果您执行“魔术”,那么编译器可以进行优化以破坏您的代码。遵守规则,不要使用魔法。

在您链接到的示例中,代码依赖于编译器,他们将一个特定的值放入一个永远不会访问并立即不存在的变量中。编译器不需要做任何对代码操作没有影响的事情。

可能影响代码的唯一方法是它是否偷看堆栈的未分配部分或依赖于堆栈上具有先前具有的值的新分配。要求编译器这样做会使大量优化变得不可能,包括用寄存器替换局部变量。

于 2013-03-21T02:40:02.623 回答