对于某些 CUDA 应用程序分析,我看到本地命中率(local_hit_rate 指标)的值为 0%。
我想用该值区分以下概念。
应用程序无权访问本地缓存。
对本地缓存的所有访问均未命中。
我怎样才能找到答案?由于inst_compute_ld_st
,ldst_issued
和的值ldst_executed
非零,是否可以丢弃第一个问题?还是有别的东西?
该设备是M2000,即CC5.3 CC5.2
nvprof 支持事件(原始计数器)和指标。这些可以使用以下命令进行查询: nvprof --query-events nvprof --query-metrics
CC5。/6。本地内存指标
local_ _request 是通过通用地址空间或本地地址空间执行到本地内存的指令数。在 CC5 上。/6.* 我不记得这是否包括完全谓词的指令。
local_*_transactions 是由于请求的大小(32 位、64 位、...)和请求的地址分歧而发生的缓存访问次数。如果这是非零,则访问本地内存。
l2_local_*_bytes 是加载/存储到 L2 缓存的数据字节数。