我正在研究应该实时运行的流体动力学 Navier-Stokes 求解器。因此,性能很重要。
现在,我正在研究许多紧密循环,每个循环都占执行时间的很大一部分:没有单一的瓶颈。这些循环中的大多数都执行一些浮点运算,但中间有很多分支。
浮点运算主要限于加法、减法、乘法、除法和比较。所有这些都是使用 32 位浮点数完成的。我的目标平台是至少带有 SSE1 指令的 x86。(我在汇编器输出中验证了编译器确实生成了 SSE 指令。)
我正在使用的大多数浮点值都有一个相当小的上限,接近零值的精度并不是很重要。所以我想到了:也许切换到定点算术可以加快速度?我知道真正确定的唯一方法是衡量它,这可能需要几天时间,所以我想事先知道成功的几率。
定点在 Doom 时代风靡一时,但我不确定它在 2010 年的表现如何。考虑到现在有多少硅投入到浮点性能中,定点算法是否仍有机会给我一个显着的速度提升?有没有人有任何可能适用于我的情况的实际经验?