我正在尝试确定我的 GPU 代码中出现减速的位置。我已经验证了代码本身可以正确运行(它不会抛出任何错误、输出正确、干净地完成等)。当我尝试在 Visual Profiler 中分析代码时,它似乎运行正常,将正确的中间输出转储到标准输出。正在使用 GPU(我已经检查了 cuda-gdb 并printf()
从我的内核中转储 s)。完成所有代码后,Visual Profiler 会报告 viper 已终止可执行文件。但是,不会生成时间线。相反,主窗口显示了 0、10、20、25 微秒,它们全部“折叠”在彼此之上。当我告诉 Visual Profiler 运行所有分析选项时,它会顺利运行 24 次,但仍然没有生成时间线。
我在带有 GeForce 460 的 Ubuntu x86_64 上使用 CUDA 4.2,驱动程序版本 295.41。