0

我正在使用启用 PC 采样的 nvprof 分析 CUDA 内核,以了解我遇到的一些延迟问题。我使用的 GPU 是 P100(计算 6.0)

PC 采样报告说 DFMA 由于内存依赖性而经常停止。DFMA 的 SASS 代码如下:

 DFMA R22, R4, R8, R22

我对这个问题的看法是,R8 需要通过 LDG.E.CI.64 加载,L2 上的未命中率非常高。

内存依赖停顿的定义是“无法进行加载/存储,因为所需的资源不可用或未充分利用,或者给定类型的太多请求未完成”。

让我感到困惑的是 DFMA 不是加载/存储操作,如果我认为停顿是由于 R8 上不可用的数据是正确的,那么它应该是执行依赖。DFMA 上的内存依赖停止意味着什么?

4

0 回答 0