您能否展示如何使用 CUDA 计算可以驻留在特定 GPU 中的最大线程数?即我可以分配给内核的最大线程数。谢谢!
问问题
2386 次
1 回答
1
您可以使用cudaGetDeviceProperties()
. 然后将其乘以您卡中的 SM 数量。
虽然这并不一定意味着您应该执行这个数量的线程。请参阅此 SO answer 以获得很好的解释。
于 2012-07-25T20:03:37.200 回答