3

我是CUDA编程新手。现在,我有一个问题要处理:我正在尝试使用 CUDA 并行编程来处理一组数据集。对于每个数据集,都需要进行一些矩阵计算。

我的设计是这样的:

  1. 启动 N 个线程来处理每个数据集,因为它们彼此独立,并且处理它们的方法是相同的。

  2. 在 1 中的每个线程中,我想使用一个新函数,这个函数也像内核一样工作,因为它们是矩阵计算......例如调用 M 个线程来并行处理矩阵计算......

有谁知道这是否可能?

4

1 回答 1

7

如果您使用 CUDA 动态并行并且您的 GPU 支持它,您可以从另一个内核中的线程启动内核。目前支持 CUDA 动态并行的 GPU 的计算能力为 3.5。

您可以从 CUDA deviceQuery示例中发现设备的计算能力。

您可以从 CUDA 编程指南部分了解有关如何使用 CUDA 动态并行性的更多信息。

于 2013-10-11T03:34:35.307 回答