我在 NUMA 机器上工作,有 2 个节点。我正在尝试分析代码以测量对远程内存的内存访问百分比。
我的机器是 AMD Interlagos (Family 15h)。Perf 支持是在 Linux 3.9 中引入的,但我在升级到 3.8 之后的内核版本时遇到了问题,所以目前我正在寻找替代方案。
我看过 PAPI,但不知道如何使用 Native Event。
我在 NUMA 机器上工作,有 2 个节点。我正在尝试分析代码以测量对远程内存的内存访问百分比。
我的机器是 AMD Interlagos (Family 15h)。Perf 支持是在 Linux 3.9 中引入的,但我在升级到 3.8 之后的内核版本时遇到了问题,所以目前我正在寻找替代方案。
我看过 PAPI,但不知道如何使用 Native Event。
尝试LIKWID。它带有一个包装工具likwid-perfctr
——只需在它的控制下运行代码。MEM
计数器组是您需要的:
likwid-perfctr -C 0-11 -g MEM ./executable
这将使用从 0 到 11 的核心上的性能计数器来衡量。根据您的具体情况进行调整。