我熟悉使用 nvprof 访问基准的事件和指标,例如,
nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname
这
system-profiling on --print-gpu-trace -o (filename)
命令给出开始时间、内核结束时间、电源、温度的时间戳,并将信息保存在 nvvp 文件中,以便我们可以在可视化分析器中查看它。这使我们能够看到代码的任何部分发生了什么,特别是在特定内核运行时。我的问题是——
有没有办法隔离仅在基准运行的一部分中计数的事件,例如在内核执行期间?在上面的命令中,
--events inst_issued1
只是给出整个可执行文件的指令。谢谢!