这是函数的原型:
v4si __builtin_ia32_shufps (v4si, v4si, int)
在一些网站上,我发现它们在 int 字段中只有十六进制,看起来像是将高位和低位分开,但我想要的是逻辑 32 位移位。
X3 X2 X1 X0 shifted by 32 bits to get X2 X1 X0 0
另一个使用 2 个 v4si 向量的示例:
X7 X6 X5 X4 | X3 X2 X1 X0, where each X is a 32 bit and what I want for a shift is the
same a logical shift, but with each vector element. So:
X7 X6 X5 X4 | X3 X2 X1 X0 << 2 = X5 X4 X3 X2 | X1 X0 0 0
shufps 是执行此操作的正确命令吗?