c - C 中的 i++ 和 ++i 之间是否存在性能差异？

Question

如果不使用结果值i++，是否存在性能差异？++i

score 436 · Accepted Answer

执行摘要：没有。

i++可能比慢++i，因为的旧值i 可能需要保存以备后用，但实际上所有现代编译器都会优化它。

我们可以通过查看这个函数的代码来证明这一点，包括++i和i++。

$ cat i++.c
extern void g(int i);
void f()
{
    int i;

    for (i = 0; i < 100; i++)
        g(i);

}

这些文件是相同的，除了++i和i++：

$ diff i++.c ++i.c
6c6
<     for (i = 0; i < 100; i++)
---
>     for (i = 0; i < 100; ++i)

我们将编译它们，并获得生成的汇编器：

$ gcc -c i++.c ++i.c
$ gcc -S i++.c ++i.c

我们可以看到生成的目标文件和汇编文件都是一样的。

$ md5 i++.s ++i.s
MD5 (i++.s) = 90f620dda862cd0205cd5db1f2c8c06e
MD5 (++i.s) = 90f620dda862cd0205cd5db1f2c8c06e

$ md5 *.o
MD5 (++i.o) = dd3ef1408d3a9e4287facccec53f7d22
MD5 (i++.o) = dd3ef1408d3a9e4287facccec53f7d22

score 121 · Accepted Answer

来自Andrew Koenig 的《效率与意图》：

首先，至少在涉及整数变量的情况下，它++i比更有效并不明显。i++

和：

因此，应该问的问题不是这两个操作中的哪一个更快，而是这两个操作中的哪一个更准确地表达了您要完成的任务。我认为，如果您不使用表达式的值，则永远没有理由使用i++而不是++i，因为永远没有理由复制变量的值，增加变量，然后丢弃副本。

所以，如果不使用结果值，我会使用++i. 但不是因为它更有效：因为它正确地说明了我的意图。

score 47 · Accepted Answer

一个更好的答案是++i有时会更快，但永远不会更慢。

每个人似乎都假设这i是一个常规的内置类型，例如int. 在这种情况下，不会有可测量的差异。

但是，如果i是复杂类型，那么您很可能会发现可测量的差异。因为i++你必须在增加它之前复制你的类。根据副本中涉及的内容，它确实可能会更慢，因为++i您可以只返回最终值。

Foo Foo::operator++()
{
  Foo oldFoo = *this; // copy existing value - could be slow
  // yadda yadda, do increment
  return oldFoo;
}

另一个区别是++i您可以选择返回引用而不是值。同样，根据制作对象副本所涉及的内容，这可能会更慢。

可能发生这种情况的真实示例是使用迭代器。复制迭代器不太可能成为应用程序中的瓶颈，但养成使用++i而不i++影响结果的习惯仍然是一种好习惯。

score 21 · Accepted Answer

简短的回答：

速度之间i++和++i速度方面从来没有任何区别。一个好的编译器不应该在这两种情况下生成不同的代码。

长答案：

每个其他答案都没有提到的是，与之间的++i区别i++仅在找到的表达式中才有意义。

在的情况下for(i=0; i<n; i++)，i++在它自己的表达式中是单独的：在它之前有一个序列点，i++在它之后有一个。因此，生成的唯一机器代码是“增加i” 1，并且它是明确定义的，它是如何相对于程序的其余部分进行排序的。因此，如果您将其更改为 prefix ++，一点也不重要，您仍然会得到机器代码“增加i” 1。

++i和之间的区别仅在vsi++等表达式中很重要。有些人可能会争辩说，后缀在此类操作中会变慢，因为驻留的寄存器必须稍后重新加载。但是请注意，编译器可以随意以任何方式对您的指令进行排序，只要它不会像 C 标准所称的那样“破坏抽象机器的行为”。array[i++] = x;array[++i] = x;i

因此，虽然您可能会假设将其array[i++] = x;转换为机器代码：

将的值存储i在寄存器 A 中。
将数组的地址存储在寄存器 B 中。
添加A和B，将结果存储在A中。
在这个由 A 表示的新地址处，存储 x 的值。
将值存储i在寄存器 A // 效率低，因为这里有额外的指令，我们已经这样做了一次。
递增寄存器 A。
将寄存器 A 存储在i.

编译器还不如更有效地生成代码，例如：

将的值存储i在寄存器 A 中。
将数组的地址存储在寄存器 B 中。
添加A和B，将结果存储在B中。
递增寄存器 A。
将寄存器 A 存储在i.
... // 其余代码。

仅仅因为您作为 C 程序员被训练认为后缀++出现在末尾，机器代码不必以这种方式排序。

因此，C 中的前缀和后缀之间没有区别++。现在，作为 C 程序员，您应该有所不同的是，人们在某些情况下不一致地使用前缀，在其他情况下使用后缀，没有任何理由。这表明他们不确定 C 是如何工作的，或者他们对该语言的了解不正确。这总是一个不好的迹象，它反过来表明他们正在他们的计划中做出其他有问题的决定，基于迷信或“宗教教条”。

“前缀++总是更快”确实是准 C 程序员中常见的错误教条之一。

score 18 · Accepted Answer

借鉴 Scott Meyers，更有效的 c++ 第 6 条：区分递增和递减操作的前缀和后缀形式。

就对象而言，前缀版本总是优于后缀版本，尤其是在迭代器方面。

如果您查看运营商的调用模式，就会出现这种情况的原因。

// Prefix
Integer& Integer::operator++()
{
    *this += 1;
    return *this;
}

// Postfix
const Integer Integer::operator++(int)
{
    Integer oldValue = *this;
    ++(*this);
    return oldValue;
}

看这个例子很容易看出前缀运算符总是比后缀更有效。因为在使用后缀时需要临时对象。

这就是为什么当您看到使用迭代器的示例时，它们总是使用前缀版本。

但是正如您为 int 指出的那样，实际上没有区别，因为可以进行编译器优化。

score 17 · Accepted Answer

如果您担心微优化，这里有一个额外的观察。递减循环“可能”比递增循环更有效（取决于指令集架构，例如 ARM），给定：

for (i = 0; i < 100; i++)

在每个循环中，您将分别获得一条指令：

添加1到i.
比较是否i小于 a 100。
条件分支 ifi小于 a 100。

而递减循环：

for (i = 100; i != 0; i--)

该循环将为以下各项提供一条指令：

递减i，设置 CPU 寄存器状态标志。
取决于 CPU 寄存器状态的条件分支 ( Z==0)。

当然，这仅在减为零时才有效！

从 ARM 系统开发人员指南中记住。

score 14 · Accepted Answer

首先：i++和之间的区别++i在 C 中可以忽略不计。

到细节。

1. 众所周知的 C++ 问题：`++i`速度更快

在 C++ 中，如果是某种具有重载增量运算符的对象，++i则效率更高。i

为什么？
在++i中，对象首先递增，然后可以作为 const 引用传递给任何其他函数。如果表达式是，这是不可能的，foo(i++)因为现在需要在调用之前完成增量foo()，但需要将旧值传递给foo(). i因此，编译器在对原始文件执行增量运算符之前被迫制作副本。额外的构造函数/析构函数调用是不好的部分。

如上所述，这不适用于基本类型。

2.鲜为人知的事实：`i++` 可能更快

如果不需要调用构造函数/析构函数，这在 C 中总是如此，++i并且i++应该同样快，对吧？不，它们几乎同样快，但可能存在细微差异，大多数其他回答者都搞错了。

怎么可能i++更快？
关键是数据依赖性。如果需要从内存中加载该值，则需要对其进行两个后续操作，将其递增并使用它。使用++i，需要在使用该值之前完成增量。使用i++时，使用不依赖于增量，CPU 可以与增量操作并行执行使用操作。差别最多只有一个 CPU 周期，所以真的可以忽略不计，但确实存在。这与许多人所期望的相反。

score 11 · Accepted Answer

请不要让“哪个更快”的问题成为使用哪个的决定因素。您可能永远不会那么在意，此外，程序员阅读时间比机器时间昂贵得多。

使用对阅读代码的人最有意义的那个。

score 7 · Accepted Answer

@Mark即使允许编译器优化变量的（基于堆栈的）临时副本并且gcc（在最近的版本中）正在这样做，但这并不意味着所有编译器都会这样做。

我只是用我们在当前项目中使用的编译器对其进行了测试，四分之三的编译器没有对其进行优化。

永远不要假设编译器做对了，特别是如果可能更快但绝不慢的代码很容易阅读。

如果您的代码中没有一个非常愚蠢的运算符实现：

一直喜欢 ++i 而不是 i++。

score 5 · Accepted Answer

在 C 语言中，如果结果未使用，编译器通常可以将它们优化为相同。

但是，在 C++ 中，如果使用提供自己的 ++ 运算符的其他类型，则前缀版本可能会比后缀版本快。因此，如果您不需要后缀语义，最好使用前缀运算符。

score 5 · Accepted Answer

我一直在阅读这里的大部分答案和许多评论，但我没有看到任何关于我能想到的一个i++实例的参考，其中比哪里更有效++i（也许令人惊讶--i 的是比更有效i--）。这适用于 DEC PDP-11 的 C 编译器！

PDP-11 具有寄存器预减和后增的汇编指令，但反之则不然。这些指令允许将任何“通用”寄存器用作堆栈指针。因此，如果您使用类似的东西*(i++)，可以将其编译为单个汇编指令，而*(++i)不能。

这显然是一个非常深奥的例子，但它确实提供了后增量更有效的例外情况（或者我应该说是，因为这些天对 PDP-11 C 代码的需求并不多）。

score 4 · Accepted Answer

我可以想到后缀比前缀增量慢的情况：

想象一个带有寄存器的处理器A被用作累加器，它是许多指令中唯一使用的寄存器（一些小型微控制器实际上是这样的）。

现在想象以下程序及其翻译成一个假设的程序集：

前缀增量：

a = ++b + c;

; increment b
LD    A, [&b]
INC   A
ST    A, [&b]

; add with c
ADD   A, [&c]

; store in a
ST    A, [&a]

后缀增量：

a = b++ + c;

; load b
LD    A, [&b]

; add with c
ADD   A, [&c]

; store in a
ST    A, [&a]

; increment b
LD    A, [&b]
INC   A
ST    A, [&b]

请注意如何b强制重新加载的值。使用前缀增量，编译器可以只增加值并继续使用它，可能避免重新加载它，因为增量后所需的值已经在寄存器中。但是，对于后缀增量，编译器必须处理两个值，一个是旧值，一个是增量值，正如我在上面显示的那样，会导致更多的内存访问。

当然，如果不使用增量的值，例如单个i++;语句，编译器可以（并且确实）简单地生成增量指令，而不管后缀或前缀的使用。

作为旁注，我想提一下，其中存在 a 的表达式b++不能简单地转换为一个，++b而无需任何额外的努力（例如通过添加 a - 1）。因此，如果它们是某个表达式的一部分，则比较两者并不是真正有效的。通常，在你b++不能使用的表达式中使用的地方++b，所以即使++b可能更有效，它也只是错误的。例外当然是表达式请求它（例如a = b++ + 1;可以更改为a = ++b;）。

score 2 · Accepted Answer

我总是更喜欢预增量，但是......

我想指出，即使在调用 operator++ 函数的情况下，如果函数被内联，编译器也能够优化掉临时变量。由于 operator++ 通常很短并且经常在标头中实现，因此它很可能被内联。

因此，出于实际目的，这两种形式的性能可能没有太大区别。但是，我总是更喜欢预增量，因为直接表达我想说的话似乎更好，而不是依靠优化器来解决它。

此外，减少优化器的工作量可能意味着编译器运行得更快。

score 0 · Accepted Answer

我的C有点生锈，所以我提前道歉。Speedwise，我可以理解结果。但是，我对这两个文件如何输出相同的 MD5 哈希感到困惑。也许 for 循环运行相同，但以下 2 行代码不会生成不同的程序集吗？

myArray[i++] = "hello";

对比

myArray[++i] = "hello";

第一个将值写入数组，然后递增 i。然后第二个增量 i 写入数组。我不是汇编专家，但我只是看不到这两条不同的代码行将如何生成相同的可执行文件。

只是我的两分钱。

c - C 中的 i++ 和 ++i 之间是否存在性能差异？

14 回答 14

1. 众所周知的 C++ 问题：++i速度更快

2.鲜为人知的事实：i++ 可能更快

Related

Reference

1. 众所周知的 C++ 问题：`++i`速度更快

2.鲜为人知的事实：`i++` 可能更快