以下链接指向的代码适用于 Tesla C1060,但不适用于配备 Quadro 3000M 的移动工作站。
这主要是代码的作用:
Quadro 3000M 上的执行只是跳过内核并在几毫秒内输出一个空白图像。Tesla C1060 上的执行在(比如说)100 秒内输出处理后的图像。奇怪的是,在过去的几天里,c1060 上的执行也显得相当不可预测(有时会跳过内核,有时会输出奇怪的数字为 -10^12,..)。我不明白这种行为。会不会是驱动版本问题?
预先感谢您的帮助。
附言。ubuntu 11.10 上的两台机器
Quadro 3000M ---> Cuda compilation tools, release 4.1, V0.2.1221
Tesla C1060 ---> Cuda compilation tools, release 4.1, V0.2.1221
编辑:这个问题很可能与我的两张卡的不同 GPU 架构有关。