在实习期间,我试图在 GPU 上并行化对象定位算法。但是 OpenCL 的最大浮点精度变得很成问题。
参考算法一直使用双精度实现,特别是对于 SVM 分类器和描述符。我的以单精度实现导致错误。我检查了我的标准化错误,并在我的程序的几个点 (10^-6) 中得到了我所期望的结果。
然而,这些错误在过程的分类步骤之后变得更加重要。
有没有办法用只支持单精度的 GPU 来模拟双精度值?
PS:我可以在我的 GPU(Nvidia GTS450)上使用双精度,但该程序将在几个平台上进行测试,功率要小得多,这可能意味着没有双精度。