1

当我们谈论 GPU 上 Cuda 中的并行程序比 CPU 上类似的顺序程序更快时,顺序程序是否应该由编译器优化器 (gcc -O2) 编译?

我在 GPU 上并行了一个程序。与没有编译器优化器的 CPU 实现相比,它的速度提高了 18 倍。但是当我将选项 -O2 添加到 nvcc 编译器时,加速率降低到 8。

4

1 回答 1

1

当然,在比较性能时,GPU 和 CPU 程序都应该使用优化器。

如果您专注于 GPU 与 CPU,则比较不应受到软件代码质量的影响。我们经常假设代码应该在其硬件上具有最佳性能。

于 2013-07-20T13:27:12.317 回答