我有一个 CUDA 程序,我正在三台机器上进行分析:
- 带有 GeForce 690 GTX gpu 的 Windows 7 工作站。
- 配备 NVS 5200M gpu 的 Windows 7 笔记本电脑。
- 带有 GeForce 690 GTX gpu 的 Fedora 19 工作站。
第一台机器(Windows 7 工作站)使用 GeForce 690 作为其主要显卡(除了进行 CUDA 处理)。最后两台机器(Windows 笔记本电脑和 linux 工作站)正在使用其他显卡进行显示渲染(笔记本电脑的集成显卡和 linux 工作站的低端 ATI 卡)。
我已经在所有三个平台上编译了相同的程序(设置了所有 CUDA 分析编译器标志),并且正在使用 nvvp 进行分析。#2 和 #3 机器的时间线是我所期望的:
Windows 7 笔记本电脑
Linux 工作站
但是,Windows Workstation 的分析时间线非常不同:
视窗 7 工作站
我不知道它是如何或为什么发生的,但 CPU 和 GPU 计算似乎已经不同步(至少就分析器而言)。这可能与 Windows 7 工作站没有专门用于图形的额外显卡有关吗?