0

我见过很多使用 AVX(所有三种风格)的汇编,在我见过的所有情况下,最集中的一种指令是代码执行的最好的。但是,例如,像加载到 32 位寄存器然后广播到 AVX512 或 AVX2 的所有通道这样的事情说……加载一个寄存器然后置换掉不是更好/更快吗?

特别是,混合 x86_64 和 AVX 系列指令是否会受到惩罚?我知道一般来说 SSE 和 AVX 混合会受到这样的惩罚。

我知道我可以对此进行测试,但我宁愿在开始那个小项目之前先了解大众的知识。我相信有人已经知道这一点。

4

0 回答 0