4

当我使用 Visual Studio 通过编译器内置生成 AVX2 收集指令时,它不会插入 VXORPS 指令来打破写入 YMM 寄存器的先前指令与收集之间的依赖关系。

然而,英特尔编译器确实做到了这一点,最终结果是由于数据依赖性被破坏而显着提高了性能。

由于我不想进入的原因,我不能使用英特尔编译器,那么有什么方法可以“强制”Visual Studio 插入该 VXORPS 指令?

我已经尝试创建一个中间 __m256i 并在其上调用 VXORPS,但这不起作用。

4

0 回答 0