Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 Intel Haswell CPU 的 FMA 指令来优化一些计算。
但是,我发现即使我将 MXCSR 寄存器设置为 DNZ 和 FTZ 模式,这些指令也会产生异常。
如何强制这些 FMA 指令生成 0 而不是非正规指令?
我正在处理单精度浮点数据。
只是为遇到此问题的任何人提供明确的答案:
据了解,FMA 指令确实尊重 DAZ 和 FTZ。提问者实际上得到了NaN结果,但由于对表示的字节顺序的混淆,将它们误解为非规范化。
NaN