我目前正在使用nvprof
. 我尝试检查未合并的内存负载:
nvprof --events l1_global_load_hit myapplication
返回:
1 0 0 0 l1_global_load_hit
和:
nvprof --events l1_global_load_miss myapplication
返回
1 0 0 0 l1_global_load_miss
. 有谁知道为什么我没有得到任何负载?我的内核中肯定有负载。
nvprof --events gld_request myapplication
返回:
1515884425251588442525158844252 gld_request
感谢您的帮助!