c++ - c++循环编译器优化

Question

double var = 0.;
for(int i = 0; i < 1000000 ; i++)
{
    var += sqrt(2.0);
}
std::cout << var << std::endl;

在 MSVC2012 下，是否有可能在打开优化的版本下， sqrt(2.0) 将被替换为 call 的值，而不是调用它 1*10^6 次？

asm 看起来像这样，不确定它的解释：

; Line 6
    push    ebp
    mov ebp, esp
    sub esp, 84                 ; 00000054H
    push    ebx
    push    esi
    push    edi
; Line 8
    movsd   xmm0, QWORD PTR __real@0000000000000000
    movsd   QWORD PTR _var$[ebp], xmm0
; Line 9
    mov DWORD PTR _i$1[ebp], 0
    jmp SHORT $LN3@main
$LN2@main:
    mov eax, DWORD PTR _i$1[ebp]
    add eax, 1
    mov DWORD PTR _i$1[ebp], eax
$LN3@main:
    cmp DWORD PTR _i$1[ebp], 1000000        ; 000f4240H
    jge SHORT $LN1@main
; Line 11
    sub esp, 8
    movsd   xmm0, QWORD PTR __real@4000000000000000
    movsd   QWORD PTR [esp], xmm0
    call    _sqrt
    add esp, 8
    fstp    QWORD PTR tv85[ebp]
    movsd   xmm0, QWORD PTR tv85[ebp]
    addsd   xmm0, QWORD PTR _var$[ebp]
    movsd   QWORD PTR _var$[ebp], xmm0
; Line 12
    jmp SHORT $LN2@main

编辑：

对不起，上面是调试版本....

; Line 7
    push    ebp
    mov ebp, esp
    and esp, -8                 ; fffffff8H
; Line 11
    movsd   xmm0, QWORD PTR __real@4000000000000000
    call    __libm_sse2_sqrt_precise
    movsd   xmm2, QWORD PTR ?var@@3NA
    mov eax, 1000000                ; 000f4240H
$LL3@main:
    movapd  xmm1, xmm0
    addsd   xmm2, xmm1
    dec eax
    jne SHORT $LL3@main
    movsd   QWORD PTR ?var@@3NA, xmm2
; Line 13
    mov esp, ebp
    pop ebp
    ret 0

score 5 · Accepted Answer

如果我正确读取了该程序集转储，则编译器sqrt会在调试构建中留在循环中，并在优化构建中将其移出。但它本可以更具侵略性。您显示的代码可能会合法地优化为

std::cout << "1414213.56238\n" << std::flush;

as-if 规则允许编译器做任何不改变程序“可观察行为”的事情——并且执行时间不计入可观察行为。还允许编译器“了解”所有标准库函数的功能并在此基础上进行优化。

score 1 · Accepted Answer

它显然是按预期调用的：

movsd   QWORD PTR [esp], xmm0
call    _sqrt

编辑：我能想到的一种强制编译器不优化调用而不更改优化标志的方法是在命令行上传递传递给的值sqrt()或从以下位置读取它stdin：

double var = 0.;
double x;
cin >> x;
for(int i = 0; i < 1000000 ; i++) {
    var += sqrt(x);
}

我相信这应该使优化调用变得不可能，因为在编译时该值是未知的，循环可能仍会被优化，但您也可以传递计数器值。

c++ - c++循环编译器优化

2 回答 2

Related

Reference