double - 特斯拉双精度

Question

我正在寻找信息，如何在 tesla gpu 中实现硬件的双精度。我读过，两个流处理器正在处理单个双精度值，但我没有找到任何来自 nvidia 的官方文件。

提前致谢。PPS 为什么大多数 GPU 只使用单精度计算（因为颜色可以存储为 RR.GG.BB.TT，其中每个字符都是 8 位值）？

score 3 · Accepted Answer

不支持双精度不是您所说的存储格式问题（RR.GG.BB.TT），而是具有用于处理双精度操作（add、mul、madd 等）的本机内在函数（以及专用硬件）。

无论如何，大多数 GPU 只支持单精度，因为大部分 GPU 市场都在游戏市场，而游戏玩家不需要双精度。此外，大多数游戏玩家都在寻找良好的性能/价格比。就晶体管预算（和 TDP）而言，实现 DP 的成本很高，如果游戏不使用双精度，这是没有意义的。

这就是为什么您会看到高端 ATI GPU 支持双倍（HD 59xx 和 HD 58xx，但不是中等和入门级 GPU，例如 HD 57xx 及更低）。

@karlphillip：是的，你是对的，IEEE754（有点）用于 GTX 260 等 GPU，但当前的 ATI 和 NVIDIA 一代在高端部件上支持IEEE 754-2008 。

关于硬件实现，这是 IHV 通常不会告诉的秘密 :)

score 2 · Accepted Answer

Tesla 不是 GPU，它是一系列具有各种高端 GPU 的协处理器。如果你的 Tesla 内部有一个 Fermi GPU，它应该具有良好的双精度性能。

请参阅第 9 页的费米白皮书。

单精度对于常规 GPU 计算更为重要，因为它对于此类应用程序来说已经足够了。

score 1 · Accepted Answer

根据维基：

对于双精度（仅在 GTX 260 [12] 等较新的 GPU 中支持），与 IEEE 754 标准存在一些偏差：舍入到最接近偶数是倒数、除法和平方根唯一支持的舍入模式。在单精度中，不支持非规范化和信令 NaN；仅支持两种 IEEE 舍入模式（斩波和舍入到最近的偶数），并且这些模式是在每个指令的基础上而不是在控制字中指定的；除法/平方根的精度略低于单精度。

你去吧，他们实现了IEEE 754的大部分规范，但实际的实现可能是私有的和秘密的。

double - 特斯拉双精度

3 回答 3

Related

Reference