8

我在主机代码中使用 cuFFT 库调用它们工作正常,但我想从内核调用 cuFFT 库。早期版本的 CUDA 没有这种支持,但是动态并行这可能吗?

如果有任何关于如何实现这一目标的例子,那就太好了。

4

2 回答 2

6

尽管在 Kepler (cc 3.5) 卡上引入了动态并行性,但 cuFFT 仍然是主机 API,目前无法使用 cuFFT 在设备代码中创建或执行 FFT 操作。

于 2013-06-24T10:35:29.573 回答
0

无法从 GPU 内核调用 API。您必须从主机呼叫他们。如果您想在不从 DEVICE -> HOST -> DEVICE 传递的情况下运行 FFT 以继续您的详细说明,唯一的解决方案是编写一个在设备函数中执行 FFT 的内核。实际上我这样做是因为我需要并行运行更多的 FFT,而无需再次将数据传递给主机。如果您找到/有其他解决方案,请告诉我。网上有很多关于如何实现这一点的例子: - https://hackage.haskell.org/package/pure-fft-0.2.0/docs/Numeric-FFT.html

于 2015-10-09T17:08:09.750 回答