在大多数情况下,您的代码已经具备良好的性能和可读性。一个好的编译器能够检测循环不变量并进行适当的优化。考虑以下与您的代码非常接近的示例:
#include <cstdio>
#include <iterator>
void write_vector(int* begin, int* end, bool print_index = false) {
unsigned index = 0;
for(int* it = begin; it != end; ++it) {
if (print_index) {
std::printf("%d: %d\n", index, *it);
} else {
std::printf("%d\n", *it);
}
++index;
}
}
int my_vector[] = {
1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
};
int main(int argc, char** argv) {
write_vector(std::begin(my_vector), std::end(my_vector));
}
我正在使用以下命令行来编译它:
g++ --version
g++ (GCC) 4.9.1
Copyright (C) 2014 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
g++ -O3 -std=c++11 main.cpp
然后,让我们转储程序集:
objdump -d a.out | c++filt > main.s
结果组装write_vector
为:
00000000004005c0 <write_vector(int*, int*, bool)>:
4005c0: 48 39 f7 cmp %rsi,%rdi
4005c3: 41 54 push %r12
4005c5: 49 89 f4 mov %rsi,%r12
4005c8: 55 push %rbp
4005c9: 53 push %rbx
4005ca: 48 89 fb mov %rdi,%rbx
4005cd: 74 25 je 4005f4 <write_vector(int*, int*, bool)+0x34>
4005cf: 84 d2 test %dl,%dl
4005d1: 74 2d je 400600 <write_vector(int*, int*, bool)+0x40>
4005d3: 31 ed xor %ebp,%ebp
4005d5: 0f 1f 00 nopl (%rax)
4005d8: 8b 13 mov (%rbx),%edx
4005da: 89 ee mov %ebp,%esi
4005dc: 31 c0 xor %eax,%eax
4005de: bf a4 06 40 00 mov $0x4006a4,%edi
4005e3: 48 83 c3 04 add $0x4,%rbx
4005e7: 83 c5 01 add $0x1,%ebp
4005ea: e8 81 fe ff ff callq 400470 <printf@plt>
4005ef: 49 39 dc cmp %rbx,%r12
4005f2: 75 e4 jne 4005d8 <write_vector(int*, int*, bool)+0x18>
4005f4: 5b pop %rbx
4005f5: 5d pop %rbp
4005f6: 41 5c pop %r12
4005f8: c3 retq
4005f9: 0f 1f 80 00 00 00 00 nopl 0x0(%rax)
400600: 8b 33 mov (%rbx),%esi
400602: 31 c0 xor %eax,%eax
400604: bf a8 06 40 00 mov $0x4006a8,%edi
400609: 48 83 c3 04 add $0x4,%rbx
40060d: e8 5e fe ff ff callq 400470 <printf@plt>
400612: 49 39 dc cmp %rbx,%r12
400615: 75 e9 jne 400600 <write_vector(int*, int*, bool)+0x40>
400617: eb db jmp 4005f4 <write_vector(int*, int*, bool)+0x34>
400619: 0f 1f 80 00 00 00 00 nopl 0x0(%rax)
我们可以看到,在函数的请求中,我们检查了值并跳转到两个可能的循环之一:
4005cf: 84 d2 test %dl,%dl
4005d1: 74 2d je 400600 <write_vector(int*, int*, bool)+0x40>
当然,这仅在编译器能够检测到条件是实际不变的情况下才有效。通常,它非常适用于标志和简单的内联函数。但如果条件“复杂”,请考虑使用其他答案中的方法。