Architecture:
**AMD** Opteron quad-core using 2 CPUs --- Numa system
Each CPU has a shared L3 Cache ; Each Core has a private L1 and L2
Processor : x86_64 Operating System: GNU/Linux
我是Perfmon的新世界。我正在尝试获取性能计数器Last level cache misses(LLCM)
和IPS
.
当只有一个线程/核心时,我能够获取它们
当有多个时,是否也可以获取每个线程的性能计数器,如 IPS 和 LLCM 2 threads/core
?
根据我的研究 - 我意识到,当有多个线程时,不可能获得每个线程的 LCM/IPS,thread/core
因为 AMD 不提供这些性能计数器。
所以,我的问题是,是否可以在 2 级缓存中获取 PC/线程。如果是 - 如何?
谢谢。