16

最近 Herb Sutter 做了一场关于“现代 C++:你需要知道的事情”的精彩演讲。本次演讲的主题是效率以及数据局部性和访问内存的重要性。他还解释了 CPU 将如何喜欢内存(数组/向量)的线性访问。他从另一本经典参考“鲍勃·尼斯特罗姆的游戏表现”中就该主题举了一个例子。

阅读这些文章后,我了解到有两种类型的缓存会影响程序性能:

  1. 数据缓存
  2. 指令缓存

Cachegrind工具还测量我们程序的缓存类型检测信息。许多文章/博客已经解释了第一点以及如何实现良好的数据缓存效率(数据局部性)。

但是,我没有得到太多关于指令缓存主题的信息,以及我们在程序中应该注意哪些事情才能获得更好的性能?根据我的理解,我们(程序员)对执行哪条指令或执行什么顺序没有太多控制。

如果小型 c++ 程序能够解释这个计数器(即指令缓存)如何随着我们编写程序的风格而变化,那就太好了。在这一点上,程序员应该遵循哪些最佳实践来获得更好的性能?

我的意思是我们可以理解数据缓存主题,如果我们的程序以类似的方式(向量与列表)可以解释第二点。这个问题的主要目的是尽可能地理解这个话题。

4

1 回答 1

13

任何改变执行流程的代码都会影响指令缓存。这包括函数调用和循环以及取消引用函数指针。

当执行分支或跳转指令时,处理器必须花费额外的时间来决定代码是否已经在指令缓存中,或者是否需要重新加载指令缓存(从分支的目的地)。

例如,一些处理器可能有足够大的指令缓存来保存小循环的执行代码。一些处理器没有大的指令缓存并简单地重新加载它。指令高速缓存的重新加载需要花费执行指令的时间。

搜索这些主题:

  • 循环展开
  • 条件指令执行(在 ARM 处理器上可用)
  • 内联函数
  • 指令流水线

编辑 1:提高性能的编程技术
为了提高性能并减少指令缓存重新加载,请执行以下操作:

减少“if”语句 设计您的代码以尽量减少“if”语句。这可能包括布尔代数,使用更多的数学或简化比较(它们真的需要吗?)。最好减少“then”和“else”子句的内容,以便编译器可以使用条件汇编语言指令。

将小函数定义为内联或宏
调用函数会产生开销,例如存储返回位置和重新加载指令缓存。对于具有少量语句的函数,请尝试向编译器建议将它们内联。内联意味着将代码的内容粘贴到执行所在的位置,而不是进行函数调用。由于避免了函数调用,因此需要重新加载指令缓存。

展开循环
对于小型迭代,不要循环,而是重复循环的内容(某些编译器可能会在更高的优化级别设置下这样做)。重复的内容越多,循环顶部的分支数量就越少,重新加载指令缓存的需要就越少。

使用表查找,而不是“if”语句
一些程序使用“if-else-if”梯形图将数据映射到值。每个“if”语句都是指令缓存中执行的中断。有时,通过一些数学运算,可以将值放在一个像数组一样的表格中,并以数学方式计算索引。一旦知道索引,处理器就可以在不中断指令缓存的情况下检索数据。

改变数据或数据结构
如果数据的类型是不变的,程序可以围绕数据进行优化。例如,处理消息数据包的程序可以基于数据包 ID(想想函数指针数组)进行操作。功能将针对数据包处理进行优化。

将链表更改为数组或其他随机访问容器。可以使用数学而不是中断执行来访问数组的元素。必须遍历(循环)链表才能找到项目。

于 2014-04-07T19:39:31.543 回答