CUDA Profiling Guide列出了采样 warp 失速的各种原因,例如分配、障碍、LG Throttle 等。并且 - NSight Compute 分析器将这些分布显示为分析结果的一部分。
问题是,一些失速原因被列为仅从某些计算能力开始支持,例如“LG Throttle:7.0+”
我的问题:当停顿原因是这种“不受支持”的原因时,具有较早计算能力的设备会发生什么?或者,换句话说,列出的每个失速原因的回退是什么?
在 Ye Olde NVIDIA Visual Profiler 中,我们有一个“其他”停滞原因,请参阅:
但我在(我的版本)NSight Compute 中没有看到这一点。