我尝试perf
为 Intel Xeon E5 系列使用性能计数器 (linux)。
我对缓存未命中的解释感到困惑。虽然 L1 和 LLC 值很容易访问,但必须通过 -rNNN 事件从寄存器中读取 L2 的信息。但是在文档中,我还没有找到如何将事件编号与掩码字段组合以给出 NNN 值。中只有一个示例perf help
显示了值 A8 和掩码 01,结果为 1a8。但是掩蔽时的一般规则是什么?它不应该写在文档中还是标准的 OR 函数之类的?
此外,我还没有从文档或其他相关主题的回复中了解,在 Xeon 案例中测量的 LLC 值是针对 L3 还是 L2。当硬件中有第三级缓存时会发生什么?LLC 是否仍然测量最后一级,即 L3 事件?
有没有人清除它?