2

对于特定的 CUDA 流,是否存在最大数量的 CUDA 操作?我在任何文档中都没有看到这样的限制。

我也对每个 CUDA 内核的最大指令数的相关数字感兴趣。

4

1 回答 1

3

每个内核有最大数量的 CUDA PTX 指令:

  • 计算能力低于 2.0(即在 Fermi 微架构之前)的GPU 为200 万
  • 具有 2.0 或更高计算能力的 GPU(例如 Fermi、Kepler、Maxwell 等)为5.12 亿

此信息可在CUDA C Programming Guide中找到,只需查找“每个内核的最大指令数”即可。

至于流,如果在给定流上运行的内核遵守此限制,则没有此类流指令限制。正如@talonmies 指出的那样,流是主机端的操作队列,它们与将代码加载到 GPU 上无关。

于 2013-05-09T13:02:38.773 回答