在 OpenCL 世界中,有一个函数clGetEventProfilingInfo以纳秒为单位返回事件的所有分析信息,如排队、提交、开始和结束时间。这很方便,因为我可以随时获取printf
该信息。
例如,使用PyOpenCL可以编写这样的代码
profile = event.profile
print("%gs + %gs" % (1e-9*(profile.end - profile.start), 1e-9*(profile.start - profile.queued)))
这对我的任务很有帮助。