根据gcc 的文档,使用“-march=cascadelake”进行编译不会启用标志 -AVX512IFMA(如果我理解正确,它可以支持 AVX512 的 FMA 指令)。相反,例如在使用“-march=cannonlake”和“-march=tigerlake”进行编译时,会包含此标志。
然而,根据英特尔的说法,Cascade-Lake 的处理器实际上每个都包含 2 个 AVX-512 FMA 单元(这是一个示例,据我所知,这适用于任何 Cascade-Lake 处理器)。
任何人都可以澄清这种行为吗?我是否误解了 AVX512IFMA 标志的含义?