3

我有一个关于 NVIDIA GPU 性能的问题。我有一个实现,我在两个数组之间进行插值。使用倾斜到线性内存的纹理比使用 CUDA-Arrays 更快。目前我只在一个 GPU 上尝试过。每个 GPU 上都是这种情况还是会有差异?我在笔记本电脑中使用 GPU。桌面 GPU 速度快得多吗?因为目前我只获得了 2-3 的加速。

我可能看起来像一个愚蠢的问题,但我会感谢在许多 GPU 上使用纹理的人的回答。我很奇怪使用 CUDA-Arrays(应该有一些缓存优化......)会更慢。

我正在开发 NVIDIA Quadro 2000m,并将其与 I7-2860QM @ 2,50GHZ(实现)进行比较。这是一场公平的比赛吗?

4

1 回答 1

1

具有计算能力 2.0 或更高缓存全局内存以及纹理的 GPU,因此纹理在 CC 1.x 时代的主要优势已不复存在。

恰恰相反,关于纹理的一点点提到的事实是,由于需要在硬连线布局的寄存器中存储多个参数和返回值,它们会增加寄存器压力。此外,全局内存的缓存大于纹理内存的缓存。所以通过纹理读取内存会比直接访问全局内存慢也就不足为奇了。

这一特性对于移动或桌面 GPU 应该是相同的,尽管高端桌面 GPU 的速度可能比移动设备快 2 到 5 倍。

于 2012-11-24T14:59:45.697 回答