Pascal SM 每个 SM 有 4 个调度程序,当我们得到类似 3 作为 IPC 的东西时,这是否意味着 SM 在一个周期中调度了 3 条指令?此外,NVPROF 是否考虑该内核的所有 SM 的平均 IPC 并报告它?
如果一个 SM 的 IPC 为 3,那么具有 2 个 SM 的 GPU 应该给我们 6 的 IPC,对吗?
另外,我正在使用一个名为 GPGPU sim 的模拟器,它报告更高范围 (80-120) 的 IPC 我假设他们正在计算每个内核的 IPC 并将指标缩放到整个模拟 GPU,但我不确定。
有人可以验证IPC指标吗?