我正在分析Agner Fog 的 “汇编语言中的优化子程序:x86 平台的优化指南”。特别是我试图理解第 12.7 章。还有一个我无法理解的问题。作者写道:
PM 处理器中的指令解码遵循 4-1-1 模式。示例 12.6b 中循环中每条指令的(融合)μops 模式是 2-2-2-2-2-1-1-1。这不是最优的,解码需要 6 个时钟周期。这超过了退休时间,因此我们可以得出结论,指令解码是示例 12.6b 中的瓶颈。总执行时间为每次迭代 6 个时钟周期或每个计算出的 Y[i] 值 3 个时钟周期。
- 指令解码遵循 4-1-1 模式是什么意思,如何知道?
- 循环模式是 2-2-2-2-2-1-1-1。好的,但我不知道为什么解码需要 6 个周期。为什么?