有没有办法将数据传递给正在运行的 CUDA 内核?我认为可以通过异步启动内核并使用映射的固定内存来完成。使用这种方法,我可能可以在 GPU 设备内存中写入,内核代码可以从那里读取。
这种方法有一个主要的同步问题:单个线程如何在特定的内存位置上同步?
有没有办法将数据传递给正在运行的 CUDA 内核?我认为可以通过异步启动内核并使用映射的固定内存来完成。使用这种方法,我可能可以在 GPU 设备内存中写入,内核代码可以从那里读取。
这种方法有一个主要的同步问题:单个线程如何在特定的内存位置上同步?