1

CUDA Profiling Guide列出了采样 warp 失速的各种原因例如分配、障碍、LG Throttle 等。并且 - NSight Compute 分析器将这些分布显示为分析结果的一部分。

问题是,一些失速原因被列为仅从某些计算能力开始支持,例如“LG Throttle:7.0+”

我的问题:当停顿原因是这种“不受支持”的原因时,具有较早计算能力的设备会发生什么?或者,换句话说,列出的每个失速原因的回退是什么?

在 Ye Olde NVIDIA Visual Profiler 中,我们有一个“其他”停滞原因,请参阅:

Nsight 分析器显示的“其他”问题停顿原因是什么?

但我在(我的版本)NSight Compute 中没有看到这一点。

4

2 回答 2

3

Nsight Compute不受支持,也不推荐用于具有 7.0 之前计算能力的 GPU 的分析器

在不受支持的设置中,工具的行为没有正式的定义。考虑它UB。

对 cc7.0 之前具有计算能力的 GPU 使用旧版分析器(nvvp、nvprof)。

于 2021-02-02T14:50:36.170 回答
0

在 Pascal GPU (sm_61) 上使用 Nsight Compute 2019.5 分析内核,需要 7.0+ 的指标LG Throttle不会Sleeping显示为停滞原因。

翘曲状态帕斯卡

于 2021-02-03T07:46:58.897 回答