我做了一个应用程序
在此报告文件中:
1.
当我在下拉列表中选择“CUDA -> CUDA 摘要”时
在表中的Runtime API 调用项下
时间百分比- 80.66
发射
%设备时间- 15.46
所有其他时间百分比几乎为 0%
所以我的问题是,剩下的 19.34% 的时间和 84.54% 的设备时间在哪里?也就是说,如果它们表示完全不同的“总时间”值的百分比?
2.
我使用推力向量来回复制我的数据。在本报告的“内存副本”部分,我运行的备忘录副本的所有 % Time 值显然可以忽略不计。
但是你猜怎么着,当我点击运行时 API 调用的“摘要”链接(它的 % Time 值高达 80.66)时,我立即看到罪魁祸首 - 'cudaMemcpy' 和它的 'Capture Time %' 值一样高在此“运行时 API 调用摘要”页面中为 73.75 。
所以我的问题是
- 这是否意味着我的瓶颈仍然是那些对推力::复制()的调用,甚至报告的“备忘录副本”部分也没有显示它?
- 我怎样才能真正找到对我来说最昂贵的确切函数调用?
- 时间线功能如何帮助解决这些问题?