我需要一些关于如何在 Visual Studio 上使用 SSE 逻辑指令的帮助。基于MSDN 网站,
__m128 _mm_and_ps(__m128 a , __m128 b );
ANDPS
可用于对操作数a和b执行逻辑与。但我无法弄清楚获取结果所需的确切步骤(内存加载和初始化、设置、存储等)。
具体来说,我想知道如何:
- 执行操作,
- 取回结果,并且
- 获得结果的大小(有效位数)。
有人可以在一个例子中告诉我如何做到这一点吗?
谢谢!
这是一个示例 - 使用 XOR 反转浮点向量中所有元素的符号:
__m128 v1 = _mm_set_ps(0.0f, 1.0f, -1.0f, -2.0f);
// v1 = 0.0f, 1.0f, -1.0f, -2.0f
__m128 sign = _mm_set1_ps(-0.0f); // sign = -0.0f, -0.0f, -0.0f, -0.0f
__m128 v2 = _mm_xor_ps(v1, sign); // v2 = -0.0f, -1.0f, 1.0f, 2.0f
因此,假设您想对数组中的所有值求反,您可以一次执行 4 个元素,如下所示:
const int N = 1024;
float a[N];
const __m128 sign = _mm_set1_ps(-0.0f);// sign = -0.0f, -0.0f, -0.0f, -0.0f
for (int i = 0; i < N; i += 4)
{
v = _mm_loadu_ps(&a[i]); // load 4 elements (unaligned) from a[]
v = _mm_xor_ps(v1, sign); // invert sign bit (i.e. negate)
_mm_storeu_ps(&a[i], v); // store 4 elements (unaligned) back to a[]
}