如果不使用结果值i++
,是否存在性能差异?++i
14 回答
执行摘要:没有。
i++
可能比 慢++i
,因为 的旧值i
可能需要保存以备后用,但实际上所有现代编译器都会优化它。
我们可以通过查看这个函数的代码来证明这一点,包括++i
和i++
。
$ cat i++.c
extern void g(int i);
void f()
{
int i;
for (i = 0; i < 100; i++)
g(i);
}
这些文件是相同的,除了++i
和i++
:
$ diff i++.c ++i.c
6c6
< for (i = 0; i < 100; i++)
---
> for (i = 0; i < 100; ++i)
我们将编译它们,并获得生成的汇编器:
$ gcc -c i++.c ++i.c
$ gcc -S i++.c ++i.c
我们可以看到生成的目标文件和汇编文件都是一样的。
$ md5 i++.s ++i.s
MD5 (i++.s) = 90f620dda862cd0205cd5db1f2c8c06e
MD5 (++i.s) = 90f620dda862cd0205cd5db1f2c8c06e
$ md5 *.o
MD5 (++i.o) = dd3ef1408d3a9e4287facccec53f7d22
MD5 (i++.o) = dd3ef1408d3a9e4287facccec53f7d22
来自Andrew Koenig 的《效率与意图》:
首先,至少在涉及整数变量的情况下,它
++i
比 更有效并不明显。i++
和 :
因此,应该问的问题不是这两个操作中的哪一个更快,而是这两个操作中的哪一个更准确地表达了您要完成的任务。我认为,如果您不使用表达式的值,则永远没有理由使用
i++
而不是++i
,因为永远没有理由复制变量的值,增加变量,然后丢弃副本。
所以,如果不使用结果值,我会使用++i
. 但不是因为它更有效:因为它正确地说明了我的意图。
一个更好的答案是++i
有时会更快,但永远不会更慢。
每个人似乎都假设这i
是一个常规的内置类型,例如int
. 在这种情况下,不会有可测量的差异。
但是,如果i
是复杂类型,那么您很可能会发现可测量的差异。因为i++
你必须在增加它之前复制你的类。根据副本中涉及的内容,它确实可能会更慢,因为++i
您可以只返回最终值。
Foo Foo::operator++()
{
Foo oldFoo = *this; // copy existing value - could be slow
// yadda yadda, do increment
return oldFoo;
}
另一个区别是++i
您可以选择返回引用而不是值。同样,根据制作对象副本所涉及的内容,这可能会更慢。
可能发生这种情况的真实示例是使用迭代器。复制迭代器不太可能成为应用程序中的瓶颈,但养成使用++i
而不i++
影响结果的习惯仍然是一种好习惯。
简短的回答:
速度之间i++
和++i
速度方面从来没有任何区别。一个好的编译器不应该在这两种情况下生成不同的代码。
长答案:
每个其他答案都没有提到的是,与之间的++i
区别i++
仅在找到的表达式中才有意义。
在 的情况下for(i=0; i<n; i++)
,i++
在它自己的表达式中是单独的:在它之前有一个序列点,i++
在它之后有一个。因此,生成的唯一机器代码是“增加i
” 1
,并且它是明确定义的,它是如何相对于程序的其余部分进行排序的。因此,如果您将其更改为 prefix ++
,一点也不重要,您仍然会得到机器代码“增加i
” 1
。
++i
和之间的区别仅在vsi++
等表达式中很重要。有些人可能会争辩说,后缀在此类操作中会变慢,因为驻留的寄存器必须稍后重新加载。但是请注意,编译器可以随意以任何方式对您的指令进行排序,只要它不会像 C 标准所称的那样“破坏抽象机器的行为”。array[i++] = x;
array[++i] = x;
i
因此,虽然您可能会假设将其array[i++] = x;
转换为机器代码:
- 将 的值存储
i
在寄存器 A 中。 - 将数组的地址存储在寄存器 B 中。
- 添加A和B,将结果存储在A中。
- 在这个由 A 表示的新地址处,存储 x 的值。
- 将值存储
i
在寄存器 A // 效率低,因为这里有额外的指令,我们已经这样做了一次。 - 递增寄存器 A。
- 将寄存器 A 存储在
i
.
编译器还不如更有效地生成代码,例如:
- 将 的值存储
i
在寄存器 A 中。 - 将数组的地址存储在寄存器 B 中。
- 添加A和B,将结果存储在B中。
- 递增寄存器 A。
- 将寄存器 A 存储在
i
. - ... // 其余代码。
仅仅因为您作为 C 程序员被训练认为后缀++
出现在末尾,机器代码不必以这种方式排序。
因此,C 中的前缀和后缀之间没有区别++
。现在,作为 C 程序员,您应该有所不同的是,人们在某些情况下不一致地使用前缀,在其他情况下使用后缀,没有任何理由。这表明他们不确定 C 是如何工作的,或者他们对该语言的了解不正确。这总是一个不好的迹象,它反过来表明他们正在他们的计划中做出其他有问题的决定,基于迷信或“宗教教条”。
“前缀++
总是更快”确实是准 C 程序员中常见的错误教条之一。
借鉴 Scott Meyers,更有效的 c++ 第 6 条:区分递增和递减操作的前缀和后缀形式。
就对象而言,前缀版本总是优于后缀版本,尤其是在迭代器方面。
如果您查看运营商的调用模式,就会出现这种情况的原因。
// Prefix
Integer& Integer::operator++()
{
*this += 1;
return *this;
}
// Postfix
const Integer Integer::operator++(int)
{
Integer oldValue = *this;
++(*this);
return oldValue;
}
看这个例子很容易看出前缀运算符总是比后缀更有效。因为在使用后缀时需要临时对象。
这就是为什么当您看到使用迭代器的示例时,它们总是使用前缀版本。
但是正如您为 int 指出的那样,实际上没有区别,因为可以进行编译器优化。
如果您担心微优化,这里有一个额外的观察。递减循环“可能”比递增循环更有效(取决于指令集架构,例如 ARM),给定:
for (i = 0; i < 100; i++)
在每个循环中,您将分别获得一条指令:
- 添加
1
到i
. - 比较是否
i
小于 a100
。 - 条件分支 if
i
小于 a100
。
而递减循环:
for (i = 100; i != 0; i--)
该循环将为以下各项提供一条指令:
- 递减
i
,设置 CPU 寄存器状态标志。 - 取决于 CPU 寄存器状态的条件分支 (
Z==0
)。
当然,这仅在减为零时才有效!
从 ARM 系统开发人员指南中记住。
首先:i++
和之间的区别++i
在 C 中可以忽略不计。
到细节。
1. 众所周知的 C++ 问题:++i
速度更快
在 C++ 中,如果是某种具有重载增量运算符的对象,++i
则效率更高。i
为什么?
在++i
中,对象首先递增,然后可以作为 const 引用传递给任何其他函数。如果表达式是,这是不可能的,foo(i++)
因为现在需要在调用之前完成增量foo()
,但需要将旧值传递给foo()
. i
因此,编译器在对原始文件执行增量运算符之前被迫制作副本。额外的构造函数/析构函数调用是不好的部分。
如上所述,这不适用于基本类型。
2.鲜为人知的事实:i++
可能更快
如果不需要调用构造函数/析构函数,这在 C 中总是如此,++i
并且i++
应该同样快,对吧?不,它们几乎同样快,但可能存在细微差异,大多数其他回答者都搞错了。
怎么可能i++
更快?
关键是数据依赖性。如果需要从内存中加载该值,则需要对其进行两个后续操作,将其递增并使用它。使用++i
,需要在使用该值之前完成增量。使用i++
时,使用不依赖于增量,CPU 可以与增量操作并行执行使用操作。差别最多只有一个 CPU 周期,所以真的可以忽略不计,但确实存在。这与许多人所期望的相反。
请不要让“哪个更快”的问题成为使用哪个的决定因素。您可能永远不会那么在意,此外,程序员阅读时间比机器时间昂贵得多。
使用对阅读代码的人最有意义的那个。
@Mark即使允许编译器优化变量的(基于堆栈的)临时副本并且gcc(在最近的版本中)正在这样做,但这并不意味着所有编译器都会这样做。
我只是用我们在当前项目中使用的编译器对其进行了测试,四分之三的编译器没有对其进行优化。
永远不要假设编译器做对了,特别是如果可能更快但绝不慢的代码很容易阅读。
如果您的代码中没有一个非常愚蠢的运算符实现:
一直喜欢 ++i 而不是 i++。
在 C 语言中,如果结果未使用,编译器通常可以将它们优化为相同。
但是,在 C++ 中,如果使用提供自己的 ++ 运算符的其他类型,则前缀版本可能会比后缀版本快。因此,如果您不需要后缀语义,最好使用前缀运算符。
我一直在阅读这里的大部分答案和许多评论,但我没有看到任何关于我能想到的一个i++
实例的参考,其中比哪里更有效++i
(也许令人惊讶--i
的是比 更有效i--
)。这适用于 DEC PDP-11 的 C 编译器!
PDP-11 具有寄存器预减和后增的汇编指令,但反之则不然。这些指令允许将任何“通用”寄存器用作堆栈指针。因此,如果您使用类似的东西*(i++)
,可以将其编译为单个汇编指令,而*(++i)
不能。
这显然是一个非常深奥的例子,但它确实提供了后增量更有效的例外情况(或者我应该说是,因为这些天对 PDP-11 C 代码的需求并不多)。
我可以想到后缀比前缀增量慢的情况:
想象一个带有寄存器的处理器A
被用作累加器,它是许多指令中唯一使用的寄存器(一些小型微控制器实际上是这样的)。
现在想象以下程序及其翻译成一个假设的程序集:
前缀增量:
a = ++b + c;
; increment b
LD A, [&b]
INC A
ST A, [&b]
; add with c
ADD A, [&c]
; store in a
ST A, [&a]
后缀增量:
a = b++ + c;
; load b
LD A, [&b]
; add with c
ADD A, [&c]
; store in a
ST A, [&a]
; increment b
LD A, [&b]
INC A
ST A, [&b]
请注意如何b
强制重新加载 的值。使用前缀增量,编译器可以只增加值并继续使用它,可能避免重新加载它,因为增量后所需的值已经在寄存器中。但是,对于后缀增量,编译器必须处理两个值,一个是旧值,一个是增量值,正如我在上面显示的那样,会导致更多的内存访问。
当然,如果不使用增量的值,例如单个i++;
语句,编译器可以(并且确实)简单地生成增量指令,而不管后缀或前缀的使用。
作为旁注,我想提一下,其中存在 a 的表达式b++
不能简单地转换为一个,++b
而无需任何额外的努力(例如通过添加 a - 1
)。因此,如果它们是某个表达式的一部分,则比较两者并不是真正有效的。通常,在你b++
不能使用的表达式中使用的地方++b
,所以即使++b
可能更有效,它也只是错误的。例外当然是表达式请求它(例如a = b++ + 1;
可以更改为a = ++b;
)。
我总是更喜欢预增量,但是......
我想指出,即使在调用 operator++ 函数的情况下,如果函数被内联,编译器也能够优化掉临时变量。由于 operator++ 通常很短并且经常在标头中实现,因此它很可能被内联。
因此,出于实际目的,这两种形式的性能可能没有太大区别。但是,我总是更喜欢预增量,因为直接表达我想说的话似乎更好,而不是依靠优化器来解决它。
此外,减少优化器的工作量可能意味着编译器运行得更快。
我的C有点生锈,所以我提前道歉。Speedwise,我可以理解结果。但是,我对这两个文件如何输出相同的 MD5 哈希感到困惑。也许 for 循环运行相同,但以下 2 行代码不会生成不同的程序集吗?
myArray[i++] = "hello";
对比
myArray[++i] = "hello";
第一个将值写入数组,然后递增 i。然后第二个增量 i 写入数组。我不是汇编专家,但我只是看不到这两条不同的代码行将如何生成相同的可执行文件。
只是我的两分钱。