1

也许这个问题有点太笼统了,但也许有人遇到过同样的问题。

我有一个使用推力的小型 cuda 程序,一切都很好。它按预期工作。

但是当我将同一个程序移植到另一台机器上时,整个程序的性能比原来的机器慢了大约 10 到 100 倍。第二台机器的硬件应该更快(GTX480而不是GTX265),所以我猜问题出在第二台机器本身。有谁知道可能出了什么问题?

4

1 回答 1

1

是的, --arch=sm_20 解决了这个问题。

于 2011-03-08T19:47:48.877 回答