opencl - OpenCL 浮点精度管理

Question

在实习期间，我试图在 GPU 上并行化对象定位算法。但是 OpenCL 的最大浮点精度变得很成问题。

参考算法一直使用双精度实现，特别是对于 SVM 分类器和描述符。我的以单精度实现导致错误。我检查了我的标准化错误，并在我的程序的几个点 (10^-6) 中得到了我所期望的结果。

然而，这些错误在过程的分类步骤之后变得更加重要。

有没有办法用只支持单精度的 GPU 来模拟双精度值？

PS：我可以在我的 GPU（Nvidia GTS450）上使用双精度，但该程序将在几个平台上进行测试，功率要小得多，这可能意味着没有双精度。

score 0 · Accepted Answer

0

于 2013-08-14T13:50:27.593 回答

1 回答 1