我有一个提供峰值 GFLOPS 规格的设备,我想测量我的程序离它有多远。由于我使用的所有数据都是双精度的,我是否应该将操作数乘以 2 以获得 GLOPS 值并进行比较?
问问题
1845 次
2 回答
3
No. 1 双精度浮点运算仍然是一种浮点运算。
大多数 GPU 处理双精度数据的速度比单精度慢,因此峰值 GFLOPS 应该有两种规格。一个峰值单精度 GFLOPS 规格和一个峰值双精度 GFLOPS 规格。有时它会被进一步破坏,因此(例如)峰值分割性能与峰值附加性能分开列出。
于 2013-03-19T18:54:08.120 回答
0
“ ... ,我应该将操作数乘以 2 以获得 GLOPS 值并进行比较吗?”
不,不适用于这些卡中的任何一张(但一张):http ://www.geeks3d.com/20140305/amd-radeon-and-nvidia-geforce-fp32-fp64-gflops-table-computing/ 。
请注意,在大多数情况下,该比率从 1/24 到 1/3 不等,另请注意,“工作站显卡”的比率为 1/2 - 它专门设计用于提高 DP 性能。
您需要阅读卡中硬件的规格,并确定从 SP 切换到 DP 时应该预期的性能损失。将额外的精度加载到寄存器(硬件将在其中执行操作的内存)并在每次操作后检索额外的精度将会有少量额外的开销。
于 2015-06-08T14:05:15.280 回答