cuda - 在不同的内核调用之间将数据传输到 gpu

Question

我有一个数据需要被多个内核访问，即如下：

//send array for results to GPU
//send data to be accessed by all kernels to GPU
call kernel1<<...>>
call kernel2<<...>>
...
call kernelN<<...>>
//retrieve array of results from GPU

有没有可能做或不做？即让我的数据和结果数组留在 GPU 的全局内存中，直到我完成所有内核。还是我必须始终在每次内核调用之前和之后发送数据并检索结果？谢谢！

score 2 · Accepted Answer

全局内存具有应用程序的生命周期，因此您不必在每次内核调用之前和之后发送数据和检索结果。它将在整个应用程序期间停留在那里，而不仅仅是在内核调用期间。

cuda - 在不同的内核调用之间将数据传输到 gpu

1 回答 1

Related

Reference