509

如果不使用结果值i++,是否存在性能差异?++i

4

14 回答 14

436

执行摘要:没有。

i++可能比 慢++i,因为 的旧值i 可能需要保存以备后用,但实际上所有现代编译器都会优化它。

我们可以通过查看这个函数的代码来证明这一点,包括++ii++

$ cat i++.c
extern void g(int i);
void f()
{
    int i;

    for (i = 0; i < 100; i++)
        g(i);

}

这些文件是相同的,除了++ii++

$ diff i++.c ++i.c
6c6
<     for (i = 0; i < 100; i++)
---
>     for (i = 0; i < 100; ++i)

我们将编译它们,并获得生成的汇编器:

$ gcc -c i++.c ++i.c
$ gcc -S i++.c ++i.c

我们可以看到生成的目标文件和汇编文件都是一样的。

$ md5 i++.s ++i.s
MD5 (i++.s) = 90f620dda862cd0205cd5db1f2c8c06e
MD5 (++i.s) = 90f620dda862cd0205cd5db1f2c8c06e

$ md5 *.o
MD5 (++i.o) = dd3ef1408d3a9e4287facccec53f7d22
MD5 (i++.o) = dd3ef1408d3a9e4287facccec53f7d22
于 2008-08-24T06:48:58.827 回答
121

来自Andrew Koenig 的《效率与意图》:

首先,至少在涉及整数变量的情况下,它++i比 更有效并不明显。i++

和 :

因此,应该问的问题不是这两个操作中的哪一个更快,而是这两个操作中的哪一个更准确地表达了您要完成的任务。我认为,如果您不使用表达式的值,则永远没有理由使用i++而不是++i,因为永远没有理由复制变量的值,增加变量,然后丢弃副本。

所以,如果不使用结果值,我会使用++i. 但不是因为它更有效:因为它正确地说明了我的意图。

于 2008-09-02T11:48:15.977 回答
47

一个更好的答案是++i有时会更快,但永远不会更慢。

每个人似乎都假设这i是一个常规的内置类型,例如int. 在这种情况下,不会有可测量的差异。

但是,如果i是复杂类型,那么您很可能会发现可测量的差异。因为i++你必须在增加它之前复制你的类。根据副本中涉及的内容,它确实可能会更慢,因为++i您可以只返回最终值。

Foo Foo::operator++()
{
  Foo oldFoo = *this; // copy existing value - could be slow
  // yadda yadda, do increment
  return oldFoo;
}

另一个区别是++i您可以选择返回引用而不是值。同样,根据制作对象副本所涉及的内容,这可能会更慢。

可能发生这种情况的真实示例是使用迭代器。复制迭代器不太可能成为应用程序中的瓶颈,但养成使用++i而不i++影响结果的习惯仍然是一种好习惯。

于 2008-08-25T04:49:21.710 回答
21

简短的回答:

速度之间i++++i速度方面从来没有任何区别。一个好的编译器不应该在这两种情况下生成不同的代码。

长答案:

每个其他答案都没有提到的是,与之间的++i区别i++仅在找到的表达式中才有意义。

在 的情况下for(i=0; i<n; i++)i++在它自己的表达式中是单独的:在它之前有一个序列点,i++在它之后有一个。因此,生成的唯一机器代码是“增加i1,并且它是明确定义的,它是如何相对于程序的其余部分进行排序的。因此,如果您将其更改为 prefix ++,一点也不重要,您仍然会得到机器代码“增加i1

++i和之间的区别仅在vsi++等表达式中很重要。有些人可能会争辩说,后缀在此类操作中会变慢,因为驻留的寄存器必须稍后重新加载。但是请注意,编译器可以随意以任何方式对您的指令进行排序,只要它不会像 C 标准所称的那样“破坏抽象机器的行为”。array[i++] = x;array[++i] = x;i

因此,虽然您可能会假设将其array[i++] = x;转换为机器代码:

  • 将 的值存储i在寄存器 A 中。
  • 将数组的地址存储在寄存器 B 中。
  • 添加A和B,将结果存储在A中。
  • 在这个由 A 表示的新地址处,存储 x 的值。
  • 将值存储i在寄存器 A // 效率低,因为这里有额外的指令,我们已经这样做了一次。
  • 递增寄存器 A。
  • 将寄存器 A 存储在i.

编译器还不如更有效地生成代码,例如:

  • 将 的值存储i在寄存器 A 中。
  • 将数组的地址存储在寄存器 B 中。
  • 添加A和B,将结果存储在B中。
  • 递增寄存器 A。
  • 将寄存器 A 存储在i.
  • ... // 其余代码。

仅仅因为您作为 C 程序员被训练认为后缀++出现在末尾,机器代码不必以这种方式排序。

因此,C 中的前缀和后缀之间没有区别++。现在,作为 C 程序员,您应该有所不同的是,人们在某些情况下不一致地使用前缀,在其他情况下使用后缀,没有任何理由。这表明他们不确定 C 是如何工作的,或者他们对该语言的了解不正确。这总是一个不好的迹象,它反过来表明他们正在他们的计划中做出其他有问题的决定,基于迷信或“宗教教条”。

“前缀++总是更快”确实是准 C 程序员中常见的错误教条之一。

于 2014-10-21T09:10:26.517 回答
18

借鉴 Scott Meyers,更有效的 c++ 第 6 条:区分递增和递减操作的前缀和后缀形式

就对象而言,前缀版本总是优于后缀版本,尤其是在迭代器方面。

如果您查看运营商的调用模式,就会出现这种情况的原因。

// Prefix
Integer& Integer::operator++()
{
    *this += 1;
    return *this;
}

// Postfix
const Integer Integer::operator++(int)
{
    Integer oldValue = *this;
    ++(*this);
    return oldValue;
}

看这个例子很容易看出前缀运算符总是比后缀更有效。因为在使用后缀时需要临时对象。

这就是为什么当您看到使用迭代器的示例时,它们总是使用前缀版本。

但是正如您为 int 指出的那样,实际上没有区别,因为可以进行编译器优化。

于 2008-08-25T04:29:02.587 回答
17

如果您担心微优化,这里有一个额外的观察。递减循环“可能”比递增循环更有效(取决于指令集架构,例如 ARM),给定:

for (i = 0; i < 100; i++)

在每个循环中,您将分别获得一条指令:

  1. 添加1i.
  2. 比较是否i小于 a 100
  3. 条件分支 ifi小于 a 100

而递减循环:

for (i = 100; i != 0; i--)

该循环将为以下各项提供一条指令:

  1. 递减i,设置 CPU 寄存器状态标志。
  2. 取决于 CPU 寄存器状态的条件分支 ( Z==0)。

当然,这仅在减为零时才有效!

从 ARM 系统开发人员指南中记住。

于 2008-09-02T11:39:43.797 回答
14

首先:i++和之间的区别++i在 C 中可以忽略不计。


到细节。

1. 众所周知的 C++ 问题:++i速度更快

在 C++ 中,如果是某种具有重载增量运算符的对象,++i则效率更高。i

为什么?
++i中,对象首先递增,然后可以作为 const 引用传递给任何其他函数。如果表达式是,这是不可能的,foo(i++)因为现在需要在调用之前完成增量foo(),但需要将旧值传递给foo(). i因此,编译器在对原始文件执行增量运算符之前被迫制作副本。额外的构造函数/析构函数调用是不好的部分。

如上所述,这不适用于基本类型。

2.鲜为人知的事实:i++ 可能更快

如果不需要调用构造函数/析构函数,这在 C 中总是如此,++i并且i++应该同样快,对吧?不,它们几乎同样快,但可能存在细微差异,大多数其他回答者都搞错了。

怎么可能i++更快?
关键是数据依赖性。如果需要从内存中加载该值,则需要对其进行两个后续操作,将其递增并使用它。使用++i,需要在使用该值之前完成增量。使用i++时,使用不依赖于增量,CPU 可以与增量操作并行执行使用操作。差别最多只有一个 CPU 周期,所以真的可以忽略不计,但确实存在。这与许多人所期望的相反。

于 2014-06-04T18:34:44.247 回答
11

请不要让“哪个更快”的问题成为使用哪个的决定因素。您可能永远不会那么在意,此外,程序员阅读时间比机器时间昂贵得多。

使用对阅读代码的人最有意义的那个。

于 2008-09-20T05:09:18.377 回答
7

@Mark即使允许编译器优化变量的(基于堆栈的)临时副本并且gcc(在最近的版本中)正在这样做,但这并不意味着所有编译器都会这样做。

我只是用我们在当前项目中使用的编译器对其进行了测试,四分之三的编译器没有对其进行优化。

永远不要假设编译器做对了,特别是如果可能更快但绝不慢的代码很容易阅读。

如果您的代码中没有一个非常愚蠢的运算符实现:

一直喜欢 ++i 而不是 i++。

于 2009-02-09T15:40:45.023 回答
5

在 C 语言中,如果结果未使用,编译器通常可以将它们优化为相同。

但是,在 C++ 中,如果使用提供自己的 ++ 运算符的其他类型,则前缀版本可能会比后缀版本快。因此,如果您不需要后缀语义,最好使用前缀运算符。

于 2008-08-24T14:29:01.637 回答
5

我一直在阅读这里的大部分答案和许多评论,但我没有看到任何关于我能想到的一个i++实例的参考,其中比哪里更有效++i(也许令人惊讶--i 的是比 更有效i--)。这适用于 DEC PDP-11 的 C 编译器!

PDP-11 具有寄存器预减和后增的汇编指令,但反之则不然。这些指令允许将任何“通用”寄存器用作堆栈指针。因此,如果您使用类似的东西*(i++),可以将其编译为单个汇编指令,而*(++i)不能。

这显然是一个非常深奥的例子,但它确实提供了后增量更有效的例外情况(或者我应该说,因为这些天对 PDP-11 C 代码的需求并不多)。

于 2019-08-15T22:45:11.823 回答
4

我可以想到后缀比前缀增量慢的情况:

想象一个带有寄存器的处理器A被用作累加器,它是许多指令中唯一使用的寄存器(一些小型微控制器实际上是这样的)。

现在想象以下程序及其翻译成一个假设的程序集:

前缀增量:

a = ++b + c;

; increment b
LD    A, [&b]
INC   A
ST    A, [&b]

; add with c
ADD   A, [&c]

; store in a
ST    A, [&a]

后缀增量:

a = b++ + c;

; load b
LD    A, [&b]

; add with c
ADD   A, [&c]

; store in a
ST    A, [&a]

; increment b
LD    A, [&b]
INC   A
ST    A, [&b]

请注意如何b强制重新加载 的值。使用前缀增量,编译器可以只增加值并继续使用它,可能避免重新加载它,因为增量后所需的值已经在寄存器中。但是,对于后缀增量,编译器必须处理两个值,一个是旧值,一个是增量值,正如我在上面显示的那样,会导致更多的内存访问。

当然,如果不使用增量的值,例如单个i++;语句,编译器可以(并且确实)简单地生成增量指令,而不管后缀或前缀的使用。


作为旁注,我想提一下,其中存在 a 的表达式b++不能简单地转换为一个,++b而无需任何额外的努力(例如通过添加 a - 1)。因此,如果它们是某个表达式的一部分,则比较两者并不是真正有效的。通常,在你b++不能使用的表达式中使用的地方++b,所以即使++b可能更有效,它也只是错误的。例外当然是表达式请求它(例如a = b++ + 1;可以更改为a = ++b;)。

于 2014-06-04T17:57:51.013 回答
2

我总是更喜欢预增量,但是......

我想指出,即使在调用 operator++ 函数的情况下,如果函数被内联,编译器也能够优化掉临时变量。由于 operator++ 通常很短并且经常在标头中实现,因此它很可能被内联。

因此,出于实际目的,这两种形式的性能可能没有太大区别。但是,我总是更喜欢预增量,因为直接表达我想说的话似乎更好,而不是依靠优化器来解决它。

此外,减少优化器的工作量可能意味着编译器运行得更快。

于 2008-10-16T11:28:13.520 回答
0

我的C有点生锈,所以我提前道歉。Speedwise,我可以理解结果。但是,我对这两个文件如何输出相同的 MD5 哈希感到困惑。也许 for 循环运行相同,但以下 2 行代码不会生成不同的程序集吗?

myArray[i++] = "hello";

对比

myArray[++i] = "hello";

第一个将值写入数组,然后递增 i。然后第二个增量 i 写入数组。我不是汇编专家,但我只是看不到这两条不同的代码行将如何生成相同的可执行文件。

只是我的两分钱。

于 2008-08-24T14:22:47.940 回答