1

在实习期间,我试图在 GPU 上并行化对象定位算法。但是 OpenCL 的最大浮点精度变得很成问题。

参考算法一直使用双精度实现,特别是对于 SVM 分类器和描述符。我的以单精度实现导致错误。我检查了我的标准化错误,并在我的程序的几个点 (10^-6) 中得到了我所期望的结果。

然而,这些错误在过程的分类步骤之后变得更加重要。

有没有办法用只支持单精度的 GPU 来模拟双精度值?

PS:我可以在我的 GPU(Nvidia GTS450)上使用双精度,但该程序将在几个平台上进行测试,功率要小得多,这可能意味着没有双精度。

4

1 回答 1

0

您可能对此感兴趣:http ://www.bealto.com/mp-mandelbrot_fp128-opencl.html

于 2013-08-14T13:50:27.593 回答