1

有没有办法从 CUDA 中的设备内核触发事件(用于基准测试,类似于 CPU 代码中的 cudaEvents)?

例如,假设我想测量从内核启动到第一个启动计算的线程的时间,以及从最后一个离开计算的线程到 CPU 返回的时间。

我可以这样做吗?

4

2 回答 2

2

设备运行时 API(与动态并行一起使用)确实具有有限的流和事件支持,但不支持事件计时。

所以,不,你不能那样做。

于 2016-01-13T16:08:23.023 回答
1

一个丑陋的解决方法是写入某个托管内存位置,并让主机端线程轮询它并在值更改时触发事件。

于 2018-03-25T21:38:47.667 回答