3

我正在寻找信息,如何在 tesla gpu 中实现硬件的双精度。我读过,两个流处理器正在处理单个双精度值,但我没有找到任何来自 nvidia 的官方文件。

提前致谢。PPS 为什么大多数 GPU 只使用单精度计算(因为颜色可以存储为 RR.GG.BB.TT,其中每个字符都是 8 位值)?

PS 谷歌它对我没有帮助

4

3 回答 3

3

不支持双精度不是您所说的存储格式问题(RR.GG.BB.TT),而是具有用于处理双精度操作(add、mul、madd 等)的本机内在函数(以及专用硬件)。

无论如何,大多数 GPU 只支持单精度,因为大部分 GPU 市场都在游戏市场,而游戏玩家不需要双精度。此外,大多数游戏玩家都在寻找良好的性能/价格比。就晶体管预算(和 TDP)而言,实现 DP 的成本很高,如果游戏不使用双精度,这是没有意义的。

这就是为什么您会看到高端 ATI GPU 支持双倍(HD 59xx 和 HD 58xx,但不是中等和入门级 GPU,例如 HD 57xx 及更低)。

@karlphillip:是的,你是对的,IEEE754(有点)用于 GTX 260 等 GPU,但当前的 ATI 和 NVIDIA 一代在高端部件上支持IEEE 754-2008 。

关于硬件实现,这是 IHV 通常不会告诉的秘密 :)

于 2010-08-11T23:51:53.647 回答
2

Tesla 不是 GPU,它是一系列具有各种高端 GPU 的协处理器。如果你的 Tesla 内部有一个 Fermi GPU,它应该具有良好的双精度性能。

请参阅第 9 页的费米白皮书

单精度对于常规 GPU 计算更为重要,因为它对于此类应用程序来说已经足够了。

于 2010-08-11T20:07:02.350 回答
1

根据维基

对于双精度(仅在 GTX 260 [12] 等较新的 GPU 中支持),与 IEEE 754 标准存在一些偏差:舍入到最接近偶数是倒数、除法和平方根唯一支持的舍入模式。在单精度中,不支持非规范化和信令 NaN;仅支持两种 IEEE 舍入模式(斩波和舍入到最近的偶数),并且这些模式是在每个指令的基础上而不是在控制字中指定的;除法/平方根的精度略低于单精度。

你去吧,他们实现了IEEE 754的大部分规范,但实际的实现可能是私有的和秘密的。

于 2010-08-11T19:58:33.783 回答