我正在使用 jocl 对浮点数组的元素应用一些三角函数。虽然同时在 cpu 和 gpu 上执行相同的代码,但结果在 0.000x 数字上变化很小,而且很少见。这必须源于cpu / gpu的差异核心。一个是使用一些不同的算法(也许我弄错了)。
问题:如何告诉 opencl/jocl 使用相同的舍入/IEEE 规则来计算三角函数/指数函数?
编辑:在控制台上编写时可能是 System.out.println() 的舍入事件吗?特别是在申请 sin() 或 cos() 80000 次反馈时出现问题。
谢谢。
主机:fx8150 设备:fx8150 + hd7870(稍后将用于 2x Xeons 和 1 firegl 4800)