0

我通过执行以下操作将 OProfile 用于 OpenMP 并行化代码,

$ gcc -I/usr/include/hdf5/serial/ -std=c11 -O3 -fopt-info -fopenmp sp_linsvm.c -o sp_linsvm -lhdf5_serial
$ sudo ocount --events=CPU_CLK_UNHALTED,LLC_MISSES,LLC_REFS,MEM_INST_RETIRED,BR_MISP_EXEC, ./sp_linsvm
Events were actively counted for 22.0 seconds.
Event counts (scaled) for /home/aidan/progs/linsvm/sp_linsvm:
    Event                    Count                    % time counted
    BR_MISP_EXEC             6,523,181                80.00
    CPU_CLK_UNHALTED         225,384,009,348          80.00
    LLC_MISSES               276,587,407              80.02
    LLC_REFS                 1,098,236,806            80.00
    MEM_INST_RETIRED         51,754,855,734           79.99

我如何知道事件是按 CPU 计算还是作为一个整体计算?如果我在没有 OpenMP 的情况下编译,我很确定它作为一个整体,因为它们接近数字,但我想确定。

4

1 回答 1

1

默认模式ocount ... ./program是“命令”。据我了解,没有-t( --separate-thread) 或-c( --separate-cpu) 选项,来自所有线程的数据都会被聚合。

因此,请检查文档http://oprofile.sourceforge.net/doc/controlling-counter.html#controlling-ocount 并尝试-t/-c选项...

--separate-thread/-t 此选项可以与 --process-list 或 --thread-list 选项结合使用,以基于每个线程(每个进程)显示事件计数。如果没有此选项,所有计数都会被聚合。

--separate-cpu/-c 此选项可以与 --system-wide 或 --cpu-list 选项结合使用,以基于每个 cpu 显示事件计数。如果没有此选项,所有计数都会被聚合。

于 2016-01-09T01:46:21.747 回答