4

从线程调度和内存带宽的角度来看,这两种块大小(1024x1 与 32x32)如何执行?这两种块大小的性能是否有任何预期差异?请注意,每个块都使用 1024 个线程。

4

1 回答 1

3

线程块尺寸,特别是当我们谈论每个块相同数量的线程时,它们本身不会影响性能。

线程仍然被分组执行到 warp中。线程块维度的唯一直接影响是更改传递给每个线程的内置变量,例如threadIdx.x,blockIdx.x等,这不是性能问题。

于 2014-05-12T22:45:32.240 回答