0

当 CUDA 内核速度执行至关重要时,什么更重要?核心频率还是 SM 数量?

我可以在 Quadro K5000 和 Gtx 670 之间进行选择,但我无法决定。在这两种情况下,内存似乎都足够了,但是 quadro 有更多的 SM,而 Gtx 有更高的时钟频率(我想这个值是每个核心的)。

4

2 回答 2

2

取决于您要执行的操作。您的程序会利用 Quadro 的所有内核吗?如果没有,Gtx 会更快。如果是这样并且 Gtx 需要超过 1 个网格,您应该进行数学计算,但 Quadro 可能会更快。

于 2013-05-23T10:42:28.497 回答
2

Quadro K5000 和 GTX670 均基于相同的 GK104 芯片。Quadro 有 8 个激活的 SM,而不是 GTX470 上的 7 个。GTX670 以 915Mhz 运行,而 Quadro 以 706Mhz 运行,因此 GTX670 的整体吞吐量更好。Quadro 的带宽为 172GB/s,而 GTX670 的带宽为 192GB/s,因此 GTX670 的带宽也更好。

如果决定完全基于速度,请选择 GTX670。如果预算允许,您可能还想考虑 GTX780 或 Titan。

这本教科书的第 11 章介绍了选择哪种 GPU 卡以及为什么选择的问题。

于 2013-05-24T09:48:28.287 回答