最近,我正在阅读《大规模并行处理器编程》一书。第 3 章中的一个阅读练习要求我判断哪种 SM 作业是可能的。问题如下所示
指出每个多处理器可以进行以下哪些分配:
- 计算能力为 1.0 的设备上有 8 个块,每个块有 128 个线程。
- 计算能力为 1.2 的设备上的 8 个块,每个块有 128 个线程。
- 具有计算能力 3.0 的设备上的 8 个块,每个块有 128 个线程。
- 计算能力为 1.0 的设备上有 16 个块,每个块有 64 个线程。
- 计算能力为 1.2 的设备上的 16 个块,每个块有 64 个线程。
- 具有计算能力 3.0 的设备上的 16 个块,每个块有 64 个线程。
从最近的 CUDA 编程协会,我只找到了计算能力 3.0 的规范,它允许每个 SM 最多 16 个块和 2048 个线程,每个块最多 1024 个线程。不幸的是,我没有找到任何与计算能力 1.0 相关的信息。
谁能告诉我在哪里可以找到计算能力 1.0 的块规范?非常感谢你