OpenCL 基准测试站点http://www.clbenchmark.com/具有针对
Image Filter: Separable Gaussian Blur - Global Memory Usage and
Image Filter: Separable Gaussian Blur - Image Memory Usage
Nvidia 在全球内存使用方面完全占主导地位。例如,GTX 580 的速度几乎是 HD 7970 的两倍。它是 Nvidia 仍然领先的为数不多的基准测试之一。有人可以解释这是为什么吗?
我问的原因是我在我的 GTX 590 上写了一个光线追踪器,它运行得非常快。从大多数评论来看,我预计我的光线追踪器在 HD 7970 上的运行速度会快四倍。然而,它实际上运行速度慢了四倍!我不明白为什么。我不使用图像缓冲区。我将像素写到全局内存中。当我分析内核时间时,我发现 HD 7950 内核时间慢了四倍,所以我知道问题出在内核方面,而不是在通过 PCI 总线移动数据时。