0

一个简单的问题,真的:我有一个内核,它以每个流式多处理器 (SM) 可能的最大块数运行,并且想知道理论上我可以从中提取多少性能。理想情况下,我想知道空闲的 SM 周期的百分比,即所有扭曲都在内存访问时被阻塞。

我真的只是对找到那个号码感兴趣。我想要的是

  • 关于增加入住率的一般提示。我正在使用我能获得的所有入住率,即使我设法获得更多性能,它也不会告诉我理论上还有多少可能。
  • 如何计算理论峰值 GFlops。我的计算不是以 FP 为中心的,还有很多整数算术和逻辑也在进行。
4

1 回答 1

5
于 2012-08-21T03:39:55.613 回答