我经常使用 rdtsc 测量代码片段,这让我了解读取时间戳计数器所花费的周期,但我知道处理器(特别是我的处理器是英特尔至强)具有性能计数器来测量分支未命中和所有其他好东西。我怎么读?是否可以使用与 rdtsc ( http://en.wikipedia.org/wiki/Rdtsc ) 类似的代码?另外,我知道有一个名为 perfmon 的产品可以做到这一点,但我想自己以一种简单的编程方式来做这件事,以了解更多信息。我该如何开始呢?
问问题
1403 次