Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
据我所知,CUDA 具有流功能。它使内存传输和内核执行 在同一个中运行成为可能。当然,内存传输和内核执行中的数据是不同的。我可以用 OpenCL 做这些事情吗?因为有时当您对视频进行一些处理时。瓶颈是内存传输。
是的,您可以在 OpenCL 中重叠内存操作和内核执行。只需将函数的blocking_read参数设置为. 但是在对数据进行操作之前,您需要确保传输已经完成。为此使用事件。clEnqueueReadBUfferCL_FALSE
blocking_read
clEnqueueReadBUffer
CL_FALSE