当 SM 上正在运行的 warp 停止时,必须在 SM 上安排另一个 warp 来交换停止的 warp 以覆盖延迟。但是,与停滞的经线来自同一块的替代品还是必须属于另一个块,还是两种情况都可以?
问问题
654 次
1 回答
4
该主题是 GPU 架构社区中的一项开放研究。人们在这里评估了几种扭曲调度策略。查看以下最近的论文,了解不同调度策略的优缺点:
- 有人建议使用两级 warp 调度来提高能效:Energy-efficient Mechanisms forManaging Thread Context in Throughput Processors
- 有人建议使用两级warp调度来改善延迟隐藏:Improving GPU Performance via Large Warp and Two-Level Warp Scheduling
- 其他一些人建议按照减少 SM 的 L1 缓存争用的顺序安排扭曲:Cache-Conscious Wavefront Scheduling
- 最后,这是 NVIDIA 研究人员提出的一项专利,该专利提出了一种用于改善延迟隐藏和能源效率的调度程序。
在回答您的问题时,这两种策略都可以,并且可以在任何架构中使用。但真正的下属尚未向公众披露。
于 2012-11-27T15:51:56.357 回答