我目前正在尝试针对自制语言优化自制编译器发出的代码。
我已经尝试过英特尔 VTune,看看瓶颈在哪里:http ://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png
我发现一个“subl”指令负责运行 30-90 秒的程序中超过 38% 的时钟滴答声,这让我印象深刻!谁能解释为什么?
对于未使用 icc 编译的程序,VTune 中的“优化报告”功能显然不存在。是否存在建议优化汇编代码的程序?(也就是说,不是来自高级语言的代码)。