Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
也许这个问题有点太笼统了,但也许有人遇到过同样的问题。
我有一个使用推力的小型 cuda 程序,一切都很好。它按预期工作。
但是当我将同一个程序移植到另一台机器上时,整个程序的性能比原来的机器慢了大约 10 到 100 倍。第二台机器的硬件应该更快(GTX480而不是GTX265),所以我猜问题出在第二台机器本身。有谁知道可能出了什么问题?
是的, --arch=sm_20 解决了这个问题。