3

我正在使用带有 CUDA 4.2 的 Tesla 2075 (cc 2.0)。我在非显示GPU(特斯拉)上运行我的程序,我收到错误:

"the launch timed out and was terminated "

在非显示 GPU 上是否会出现此错误?

而且,我怎么能禁用看门狗定时器?

4

1 回答 1

4

我假设您在 Windows 上运行。如果是这样,请将 Tesla 2075 置于TCC 模式。这将允许计算访问,Windows 不会像显示设备那样管理它,这将摆脱看门狗计时器。如果您在查找 nvidia-smi 时遇到问题,只需在 Windows 中搜索 nvidia-smi.exe。(它应该已经安装了显示驱动程序。)然后,如果C2075是系统中唯一的CUDA GPU,命令将是这样的: nvidia-smi -g 0 -dm 1 您也可以nvidia-smi --help获取该工具的命令行帮助。更改此设置后,这可能需要重新启动系统,以使卡进入 TCC 模式。

另一方面,如果您在这台机器上运行 linux 和 X-windows,则解决方案会有所不同。一种方法是简单地禁用 X,例如将运行级别设置为 3 并重新启动,但还有其他方法可以做到这一点。但是,您将在另一个 GPU 上丢失 X GUI(我假设您有另一个 GPU,因为您说这是一个非显示 GPU)。要在另一个 GPU 上保留 X 和 GUI,有必要修改 xorg.conf 文件以将 X 强制到显示 GPU 上并将其从计算 (Tesla) GPU 中取出。执行此操作的方法会有所不同,但如果您有 2 个 NVIDIA GPU(一个用于显示),则应使用 xorg.conf 文件的相关“显示”部分中的 BusID 参数将 X 显示强制到单个 GPU 上。此外,应删除任何其他“显示”部分。例如:

 BusID “PCI:34:0:0”

GPU的PCI ID可以根据lspci命令或nvidia-smi –a命令来确定。

您可能还希望参考NVIDIA 驱动程序README 文件的X 配置选项附录

于 2012-11-23T09:03:32.963 回答