3

我目前正在尝试针对自制语言优化自制编译器发出的代码。

我已经尝试过英特尔 VTune,看看瓶颈在哪里:http ://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png

我发现一个“subl”指令负责运行 30-90 秒的程序中超过 38% 的时钟滴答声,这让我印象深刻!谁能解释为什么?

对于未使用 icc 编译的程序,VTune 中的“优化报告”功能显然不存在。是否存在建议优化汇编代码的程序?(也就是说,不是来自高级语言的代码)。

4

1 回答 1

2

我的猜测是,实际上是 idivl 指令占用了 38%……除法花费更长的时间比减法更有意义,不是吗?

于 2010-05-01T15:07:06.157 回答