1

以下两个代码片段生成完全相同的汇编代码,即使分支包含不同的分支预测。

假设我们有test0.c

#define likely(x)       __builtin_expect((x), 1)
#define unlikely(x)     __builtin_expect((x), 0)

int bar0();
int bar1();
int bar2();
int bar3();

int foo(int arg0) {
  if (likely(arg0 > 100)) {
    return bar0();
  } else if (likely(arg0 < -100)) {
    return bar1();
  } else if (likely(arg0 > 0)) {
    return bar2();
  } else {
    return bar3();
  }
}

test1.c

#define likely(x)       __builtin_expect((x), 1)
#define unlikely(x)     __builtin_expect((x), 0)

int bar0();
int bar1();
int bar2();
int bar3();

int foo(int arg0) {
  if (unlikely(arg0 > 100)) {
    return bar0();
  } else if (unlikely(arg0 < -100)) {
    return bar1();
  } else if (unlikely(arg0 > 0)) {
    return bar2();
  } else {
    return bar3();
  }
}

正如您通过比较两个片段所看到的那样,这两个片段对每个分支都有不同的分支预测(likely() vs. notible())。

但是,当它是从 linux 机器(ubuntu 12.04 32bit,gcc 4.6.3)编译时。这两个来源产生几乎相同的输出。

$gcc  -c -S -o test0.s test0.c
$gcc  -c -S -o test1.s test1.c
$ diff test0.s test1.s
1c1
<   .file   "test0.c"
---
>   .file   "test1.c"

如果有人能解释这一点,那将是一个很大的帮助。提前感谢您的帮助!

4

2 回答 2

3

您发布的两个文件是相同的——我认为这不是您真正所做的。

编译为-O2或更高,需要开启优化。这应该会生成不同的代码。

于 2013-03-27T16:42:42.437 回答
0

我在 ARM7 (Allwinner sun71 A20) 和 gcc 6.3 (-O3) 上进行了一些测量,#likely 和 #unlikely 之间没有性能差异,尽管从其他测试中很明显,采用分支比不采用更昂贵它,即使在完美的分支预测的情况下。

于 2020-07-02T12:31:35.280 回答