我一直在尝试在 OpenCL 中进行 FFT。像这样的内核对我有用,
__kernel void butterfly(__global float2* twid, __global float2* X,
const int n,}
{
/* Butterfly structure*/
}
我把这个内核称为数千次。因此读/写到全局内存需要太多时间。twid(float2) 数组只是读取,从不操作,数组 X 是 READ & WRITE 类型的数组。
1.哪种内存最适合这个?2. 如果我使用本地内存,是否可以将其作为参数传递给另一个内核而不将其复制到全局内存?
我是 OpenCL 的初学者。