我使用 PAPI 收集了 L2 缓存未命中数的数据。我用 4 个线程(mpirun -np 4)运行了一个 MPI 应用程序,每个线程读取 L2 中的缓存未命中。每个线程为每个时间戳输出数据。例如:
Timestamp data
xxx530 thread# 0 2136
xxx531 thread# 0 3217
.. . .
. . .
. . .
. . .
xxx550 thread# 0 412334255
xxx530 thread #1 2456
xxx531 thread#1 4243
xxx532 thread #1 4567
and so on
现在我的 qstn,是我是否应该在时间戳 xxx530 为线程 0、1、2 和 3 添加所有缓存未命中值,或者我是否为时间戳 xxx530 取 thrreda0、1、2、3 的最大值?