Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
有没有办法从 CUDA 中的设备内核触发事件(用于基准测试,类似于 CPU 代码中的 cudaEvents)?
例如,假设我想测量从内核启动到第一个启动计算的线程的时间,以及从最后一个离开计算的线程到 CPU 返回的时间。
我可以这样做吗?
设备运行时 API(与动态并行一起使用)确实具有有限的流和事件支持,但不支持事件计时。
所以,不,你不能那样做。
一个丑陋的解决方法是写入某个托管内存位置,并让主机端线程轮询它并在值更改时触发事件。