我有一个关于计算能力 1.3 和 2.0 gpu 卡的调度过程的问题。在这两种情况下,每次在流式多处理器上调度的最大块数都是 8,至少这是我从占用计算器中注意到的。
在 1.3 卡中,每个 SM 有 8 个内核,而在 2.0 卡中,每个 SM 有 32 个内核。块进程的核心是如何分布的?
对于 1.3,每个核心进程 1 块吗?如果是这样,如果每个 SM 的块少于 8 个,那么分配的核心多于一个来处理一个块?
对于 2.0,如果在 SM 中调度了 8 个块,那么是否分配了 4 个核心来处理一个块?如果 SM 中的块较少,那么会安排更多的内核进行块计算?
谢谢你。