1

自从我几周前开始使用 C 以来,我一直在看到这两个平行的短语,需要了解 C 编译器的人告诉我哪个会导致更好的代码。

版本1:

char s[]="aString",*sp=&s,c;
while(c=*sp++){
operation(c);
}

版本2:

char s[]="aString",*sp=&s;
for(;*sp;sp++){
 operation(*sp);
}


好吧,我知道版本 2 涉及一些重复的差异,那么版本 1 总是比版本 2 更好吗?如果不是,有哪些典型的例外情况?

4

3 回答 3

3

我希望这些在任何合理的优化级别上都是完全相同的——你试过了吗?

编辑:

我想确认,所以试了一下。这是我的示例程序(我也修复了您的指针不匹配错误):

void operation(char);

void f1(void)
{
    char s[]="aString",*sp=s,c;
    while(c=*sp++) {
        operation(c);
    }
}

void f2(void)
{
    char s[]="aString",*sp=s;
    for(;*sp;sp++) {
         operation(*sp);
    }
}

-O3在我的 Mac 上用 clang at 编译,这是目标文件:

example.o:
(__TEXT,__text) section
_f1:
0000000000000000    pushq   %rbp
0000000000000001    movq    %rsp,%rbp
0000000000000004    pushq   %rbx
0000000000000005    pushq   %rax
0000000000000006    movq    $0x00676e6972745361,%rax
0000000000000010    movq    %rax,0xf0(%rbp)
0000000000000014    movb    $0x61,%al
0000000000000016    leaq    0xf1(%rbp),%rbx
000000000000001a    nopw    _f1(%rax,%rax)
0000000000000020    movsbl  %al,%edi
0000000000000023    callq   _operation
0000000000000028    movb    (%rbx),%al
000000000000002a    incq    %rbx
000000000000002d    testb   %al,%al
000000000000002f    jne 0x00000020
0000000000000031    addq    $0x08,%rsp
0000000000000035    popq    %rbx
0000000000000036    popq    %rbp
0000000000000037    ret
0000000000000038    nopl    _f1(%rax,%rax)
_f2:
0000000000000040    pushq   %rbp
0000000000000041    movq    %rsp,%rbp
0000000000000044    pushq   %rbx
0000000000000045    pushq   %rax
0000000000000046    movq    $0x00676e6972745361,%rax
0000000000000050    movq    %rax,0xf0(%rbp)
0000000000000054    movb    $0x61,%al
0000000000000056    leaq    0xf1(%rbp),%rbx
000000000000005a    nopw    _f1(%rax,%rax)
0000000000000060    movsbl  %al,%edi
0000000000000063    callq   _operation
0000000000000068    movb    (%rbx),%al
000000000000006a    incq    %rbx
000000000000006d    testb   %al,%al
000000000000006f    jne 0x00000060
0000000000000071    addq    $0x08,%rsp
0000000000000075    popq    %rbx
0000000000000076    popq    %rbp
0000000000000077    ret

如您所见,字面上相同。

于 2012-08-05T04:44:02.940 回答
1

如今,任何优秀的编译器都会以几乎完全相同的方式编译这些循环。

c如果键入更短或使您的代码更易于阅读,您可能希望使用临时变量。但是不要为了某种想象中的性能优势而做这样的事情。

于 2012-08-05T04:44:24.857 回答
0

任何称职的优化编译器都会将它们优化为相同的汇编代码。除非您使用分析器对此进行了测量并确定它是一个瓶颈,否则不要费心尝试过早地对其进行优化。

在某些情况下,如果多次访问该值,编译器将无法确定底层字符串没有发生变化,在这种情况下,它必须多次访问内存。在这些情况下,将字符缓存在变量中会有非常小的优势,但即便如此,优势也会非常小。像这样的东西:

for( ; *sp; sp++) {
    operation1(*sp);
    some_function(sp);
    operation2(*sp);
}

在这种情况下,编译器可能不知道是否some_function修改了底层字符串,因此它必须*sp从内存中读取两次以确保在所有情况下都正确。

于 2012-08-05T04:44:13.883 回答