我正在尝试分析在 GTX 650 上执行的 CUDA rodinia 基准测试。我正在使用代码 /usr/local/cuda-5.0/extras/CUPTI/samples/event_sampling 来读取指令执行计数器。无论我是否正在执行 CUDA 基准测试,我都没有看到 event_sampling 报告的值有任何变化,这似乎很奇怪。
event_sampling 代码也有它自己的一些计算,它测量执行的指令。与 CPU 不同,我是否需要更改应用程序的源代码才能读取 GPU 计数器,例如指令执行?