是否可以在不阻塞主机的情况下同步两个 CUDA 流?我知道有cudaStreamWaitEvent
,这是非阻塞的。但是使用cudaEventCreate
and来创建和销毁事件呢cudaEventDestroy
?
的文档cudaEventDestroy
说:
如果调用 cudaEventDestroy() 时事件已记录但尚未完成,则该函数将立即返回,并且一旦设备完成事件,与事件相关的资源将自动释放。
我在这里不明白的是记录的事件和完成的事件之间有什么区别。此外,这似乎意味着如果事件尚未记录,则呼叫将被阻塞。
任何人都可以对此有所了解吗?