一个简单的问题,真的:我有一个内核,它以每个流式多处理器 (SM) 可能的最大块数运行,并且想知道理论上我可以从中提取多少性能。理想情况下,我想知道空闲的 SM 周期的百分比,即所有扭曲都在内存访问时被阻塞。
我真的只是对找到那个号码感兴趣。我不想要的是
- 关于增加入住率的一般提示。我正在使用我能获得的所有入住率,即使我设法获得更多性能,它也不会告诉我理论上还有多少可能。
- 如何计算理论峰值 GFlops。我的计算不是以 FP 为中心的,还有很多整数算术和逻辑也在进行。
一个简单的问题,真的:我有一个内核,它以每个流式多处理器 (SM) 可能的最大块数运行,并且想知道理论上我可以从中提取多少性能。理想情况下,我想知道空闲的 SM 周期的百分比,即所有扭曲都在内存访问时被阻塞。
我真的只是对找到那个号码感兴趣。我不想要的是