这是我认为可能是一个奇怪的问题。
有谁知道 OpenCL 中 1D FFT 的快速实现,它不是并行的。
这就是为什么我想要一个像这样实现的版本。
我有一个当前执行处理的任务:
- 接受 64 个值。
- 对此数据执行 FFT
- 对 FFT 的输出进行更多分析
- 生成大约 6 个值并返回。
这在输入的不同值上重复了大约 1-4 百万次。每组输入相互独立。
由于输入对于单个操作来说太大了,我想要么将输入分成组或某种流。
有谁知道做类似事情的示例代码。
我正处于学习 OpenCL 的早期阶段,但是这个任务要提前一点。任何帮助,将不胜感激。