1

现代处理器使用各种技巧来弥合其处理元件的高速与外部存储器的延迟之间的差距。在性能关键型应用程序中,您构建代码的方式通常会对其效率产生相当大的影响。例如,使用SLO分析器的研究人员能够修复缓存局部性问题,并将几个 SPEC2000 基准程序的执行速度提高一倍。我正在寻找一种开源工具的建议,该工具利用处理器的性能监控支持来定位和分析架构效率低下的问题,例如缓存未命中、分支错误预测、前端停止、地址别名造成的缓存污染、长延迟指令和 TLB 未命中. 我知道英特尔的VTune(商业)、AMD 的CodeAnalysist(免费,但不是开源)和Cachegrind(依赖于模拟)。

4

1 回答 1

1

对于 linux,oprofile运行良好。实际上 AMD 的 CodeAnalysist 使用 oprofile 作为其后端。

Oprofile 使用处理器的内部性能调整机制来分析架构的低效率。

于 2009-04-06T07:47:51.097 回答