0

以下链接指向的代码适用于 Tesla C1060,但不适用于配备 Quadro 3000M 的移动工作站。

这主要是代码的作用:

http://pastebin.com/9JKUMwZ4

Quadro 3000M 上的执行只是跳过内核并在几毫秒内输出一个空白图像。Tesla C1060 上的执行在(比如说)100 秒内输出处理后的图像。奇怪的是,在过去的几天里,c1060 上的执行也显得相当不可预测(有时会跳过内核,有时会输出奇怪的数字为 -10^12,..)。我不明白这种行为。会不会是驱动版本问题?

预先感谢您的帮助。

附言。ubuntu 11.10 上的两台机器

Quadro 3000M  ---> Cuda compilation tools, release 4.1, V0.2.1221
Tesla C1060   ---> Cuda compilation tools, release 4.1, V0.2.1221

编辑:这个问题很可能与我的两张卡的不同 GPU 架构有关。

4

1 回答 1

1

你有__syncthreads()内部if声明。这是不允许的,可能会导致死锁。

请参阅__syncthreads() 死锁帖子。

Cuda-memcheck 和调试器是调查此类和其他问题的最佳工具。

于 2013-01-18T06:57:00.807 回答