1

最近,我正在阅读《大规模并行处理器编程》一书。第 3 章中的一个阅读练习要求我判断哪种 SM 作业是可能的。问题如下所示

指出每个多处理器可以进行以下哪些分配:

  1. 计算能力为 1.0 的设备上有 8 个块,每个块有 128 个线程。
  2. 计算能力为 1.2 的设备上的 8 个块,每个块有 128 个线程。
  3. 具有计算能力 3.0 的设备上的 8 个块,每个块有 128 个线程。
  4. 计算能力为 1.0 的设备上有 16 个块,每个块有 64 个线程。
  5. 计算能力为 1.2 的设备上的 16 个块,每个块有 64 个线程。
  6. 具有计算能力 3.0 的设备上的 16 个块,每个块有 64 个线程。

从最近的 CUDA 编程协会,我只找到了计算能力 3.0 的规范,它允许每个 SM 最多 16 个块和 2048 个线程,每个块最多 1024 个线程。不幸的是,我没有找到任何与计算能力 1.0 相关的信息。

谁能告诉我在哪里可以找到计算能力 1.0 的块规范?非常感谢你

4

1 回答 1

1

请参阅Wikipedia 中的 CUDA页面,所有设备都有一个有效的规范。它将在计算能力(版本)部分

但这里有一张关于它的照片:

在此处输入图像描述

于 2018-12-14T08:48:18.183 回答