从线程调度和内存带宽的角度来看,这两种块大小(1024x1 与 32x32)如何执行?这两种块大小的性能是否有任何预期差异?请注意,每个块都使用 1024 个线程。
问问题
110 次
1 回答
3
线程块尺寸,特别是当我们谈论每个块相同数量的线程时,它们本身不会影响性能。
线程仍然被分组执行到 warp中。线程块维度的唯一直接影响是更改传递给每个线程的内置变量,例如threadIdx.x
,blockIdx.x
等,这不是性能问题。
于 2014-05-12T22:45:32.240 回答