我有一个数据需要被多个内核访问,即如下:
//send array for results to GPU
//send data to be accessed by all kernels to GPU
call kernel1<<...>>
call kernel2<<...>>
...
call kernelN<<...>>
//retrieve array of results from GPU
有没有可能做或不做?即让我的数据和结果数组留在 GPU 的全局内存中,直到我完成所有内核。还是我必须始终在每次内核调用之前和之后发送数据并检索结果?谢谢!