足够简单
start=cuda.Event()
func(args,block=blockdims)
cuda.memcpy_dtoh(d,h)
end=cuda.Event()
dur=start.time_till(end)
print dur
但我收到了这个错误
File "gpu.py", line 161, in gpu_test
dur=start.time_till(end)
pycuda._driver.LogicError: cuEventElapsedTime failed: invalid handle
据我所知,这是正确的用法。有人知道我在做什么错吗?