这是C代码,我用gcc编译
char *a="a";
char *d="d";
printf("%d\n", strcmp("a", "d"));
printf("%d\n", strcmp(a, "d"));
printf("%d\n", strcmp(a, d));
-O
当我用输出编译时
-1
-3
-1
当我编译时没有-O
然后输出是
-1
-3
-3
为什么输出不同,代码是strcmp
什么?
为什么输出不同
因为重要的是返回值的符号(正、负或零)。strcmp()
不需要返回 +1 或 -1,也不需要返回一致的值。我怀疑在第一种和第三种情况下,编译器优化了对的调用strcmp()
并将 -1 放入返回值的位置。在第二种情况下,我认为该函数实际上是被调用的。
strcmp的代码是什么?
从它似乎返回第一个不同字符的字符代码之间的差异这一事实推断,我会说这是 glibc 的strcmp()
:
int
strcmp (p1, p2)
const char *p1;
const char *p2;
{
register const unsigned char *s1 = (const unsigned char *) p1;
register const unsigned char *s2 = (const unsigned char *) p2;
unsigned char c1, c2;
do
{
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0')
return c1 - c2;
}
while (c1 == c2);
return c1 - c2;
}
编辑: @AndreyT 不相信我,所以这是为我生成的 GCC 4.2 程序集(OS X 10.7.5 64 位英特尔,默认优化级别 - 无标志):
.section __TEXT,__text,regular,pure_instructions
.globl _main
.align 4, 0x90
_main:
Leh_func_begin1:
pushq %rbp
Ltmp0:
movq %rsp, %rbp
Ltmp1:
subq $32, %rsp
Ltmp2:
leaq L_.str(%rip), %rax
movq %rax, -16(%rbp)
leaq L_.str1(%rip), %rax
movq %rax, -24(%rbp)
movl $-1, %ecx ; <- THIS!
xorb %dl, %dl
leaq L_.str2(%rip), %rsi
movq %rsi, %rdi
movl %ecx, %esi
movq %rax, -32(%rbp)
movb %dl, %al
callq _printf ; <- no call to `strcmp()` so far!
movq -16(%rbp), %rax
movq %rax, %rdi
movq -32(%rbp), %rsi
callq _strcmp ; <- strcmp()
movl %eax, %ecx
xorb %dl, %dl
leaq L_.str2(%rip), %rdi
movl %ecx, %esi
movb %dl, %al
callq _printf ; <- printf()
movq -16(%rbp), %rax
movq -24(%rbp), %rcx
movq %rax, %rdi
movq %rcx, %rsi
callq _strcmp ; <- strcmp()
movl %eax, %ecx
xorb %dl, %dl
leaq L_.str2(%rip), %rdi
movl %ecx, %esi
movb %dl, %al
callq _printf ; <- printf()
movl $0, -8(%rbp)
movl -8(%rbp), %eax
movl %eax, -4(%rbp)
movl -4(%rbp), %eax
addq $32, %rsp
popq %rbp
ret
Leh_func_end1:
.section __TEXT,__cstring,cstring_literals
L_.str:
.asciz "a"
L_.str1:
.asciz "d"
L_.str2:
.asciz "%d\n"
.section __TEXT,__eh_frame,coalesced,no_toc+strip_static_syms+live_support
EH_frame0:
Lsection_eh_frame:
Leh_frame_common:
Lset0 = Leh_frame_common_end-Leh_frame_common_begin
.long Lset0
Leh_frame_common_begin:
.long 0
.byte 1
.asciz "zR"
.byte 1
.byte 120
.byte 16
.byte 1
.byte 16
.byte 12
.byte 7
.byte 8
.byte 144
.byte 1
.align 3
Leh_frame_common_end:
.globl _main.eh
_main.eh:
Lset1 = Leh_frame_end1-Leh_frame_begin1
.long Lset1
Leh_frame_begin1:
Lset2 = Leh_frame_begin1-Leh_frame_common
.long Lset2
Ltmp3:
.quad Leh_func_begin1-Ltmp3
Lset3 = Leh_func_end1-Leh_func_begin1
.quad Lset3
.byte 0
.byte 4
Lset4 = Ltmp0-Leh_func_begin1
.long Lset4
.byte 14
.byte 16
.byte 134
.byte 2
.byte 4
Lset5 = Ltmp1-Ltmp0
.long Lset5
.byte 13
.byte 6
.align 3
Leh_frame_end1:
.subsections_via_symbols
以及原始源代码:
#include <stdio.h>
#include <string.h>
int main()
{
const char *a = "a";
const char *d = "d";
printf("%d\n", strcmp("a", "d"));
printf("%d\n", strcmp(a, "d"));
printf("%d\n", strcmp(a, d));
return 0;
}
以及它生成的输出(截图以获得更好的证明):
C 标准允许实现返回任何负值。只要结果符合标准,它还允许实现对库函数调用进行优化......因此,实现可以strcmp
通过生成内联机器指令而不是调用函数来优化函数。当参数是常量时,可以进行额外的优化。所以结果不同的原因是因为优化器恰好为某些情况生成了不同的代码。一个符合标准的程序不允许关心返回哪个负值。
编辑:
目前在我的系统上,输出是
-1
-3
-3
以下是编译器生成的产生这些结果的代码(使用 gcc -S 获得):
movl $-1, 4(%esp)
movl $LC2, (%esp)
call _printf
movl $LC1, 4(%esp)
movl 28(%esp), %eax
movl %eax, (%esp)
call _strcmp
movl %eax, 4(%esp)
movl $LC2, (%esp)
call _printf
movl 24(%esp), %eax
movl %eax, 4(%esp)
movl 28(%esp), %eax
movl %eax, (%esp)
call _strcmp
movl %eax, 4(%esp)
如您所见,只有两个strcmp
调用。第一次比较的 -1 结果是在编译时产生的,因为编译器知道“a”小于“d”。如果我使用 -O,它会生成以下代码:
movl $-1, 4(%esp)
movl $LC0, (%esp)
call _printf
movl $-1, 4(%esp)
movl $LC0, (%esp)
call _printf
movl $-1, 4(%esp)
movl $LC0, (%esp)
call _printf
我越来越
-1
-3
-1
在 Linux 上使用 GCC 4.1.2进行优化 ( -O4
) 构建的输出。这是编译器生成的代码main
main:
.LFB25:
subq $8, %rsp
.LCFI0:
movl $-1, %esi
xorl %eax, %eax
movl $.LC0, %edi
call printf
movzbl .LC1(%rip), %edx
movzbl .LC2(%rip), %eax
movl %edx, %esi
subl %eax, %esi
jne .L2
movzbl .LC1+1(%rip), %esi
movzbl .LC2+1(%rip), %eax
subl %eax, %esi
.L2:
movl $.LC0, %edi
xorl %eax, %eax
call printf
movl $-1, %esi
movl $.LC0, %edi
xorl %eax, %eax
call printf
xorl %eax, %eax
addq $8, %rsp
ret
这意味着第一个和最后一个比较实际上被优化了,而中间比较实际上是通过减法实现的(这就是它产生的原因-3
)。我在这种选择性行为中看不到任何逻辑,所以它可能只是优化器的一个怪癖。
顺便说一句,没有优化相同的 GCC 4.1.2 产生
-1
-1
-1
输出,因为它调用strcmp
. strcmp
在这个标准库中实现为
<strcmp> mov (%rdi),%al
<strcmp+2> cmp (%rsi),%al
<strcmp+4> jne <strcmp+19>
<strcmp+6> inc %rdi
<strcmp+9> inc %rsi
<strcmp+12> test %al,%al
<strcmp+14> jne <strcmp>
<strcmp+16> xor %eax,%eax
<strcmp+18> retq
<strcmp+19> mov $0x1,%eax
<strcmp+24> mov $0xffffffff,%ecx
<strcmp+29> cmovb %ecx,%eax
<strcmp+32> retq
这意味着它是故意实现为 return或-1
,即使它可能被视为次优。0
+1
strcmp
< 0
如果字符串不相等则返回。
它表示第二个字符串对于字符串中不匹配的第一个字符具有更高的值。确切的精确值是Unspecified。
唯一定义的是输出是否为: