3

在计算能力 <= 7.2 的设备上,我总是使用

nvprof --events shared_st_bank_conflict

但是当我使用 CUDA10 在 RTX2080ti 上运行它时,它会返回

Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2

那么如何检测此设备上是否存在共享内存库冲突?

我已经安装了 Nvidia Nsight Systems 和 Nsight Compute ,找不到这样的分析报告...

谢谢

4

2 回答 2

1

您可以使用--metrics

任何一个

nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum

从共享内存读取(加载)时的冲突,或

nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum

写入(存储)到共享内存时发生冲突。

于 2020-02-16T22:09:14.417 回答
1

这似乎是一个问题,并在这篇发给 NVIDIA 论坛的帖子中得到解决。显然,应该使用其中一种 Nsight 工具(CLI 或 UI)来支持它。

于 2019-03-22T18:53:03.177 回答