0

我需要一些关于如何在 Visual Studio 上使用 SSE 逻辑指令的帮助。基于MSDN 网站

__m128 _mm_and_ps(__m128 a , __m128 b );
ANDPS

可用于对操作数ab执行逻辑与。但我无法弄清楚获取结果所需的确切步骤(内存加载和初始化、设置、存储等)。

具体来说,我想知道如何:

  1. 执行操作,
  2. 取回结果,并且
  3. 获得结果的大小(有效位数)。

有人可以在一个例子中告诉我如何做到这一点吗?

谢谢!

4

1 回答 1

5

这是一个示例 - 使用 XOR 反转浮点向量中所有元素的符号:

__m128 v1 = _mm_set_ps(0.0f, 1.0f, -1.0f, -2.0f);
                                       //   v1 =  0.0f,  1.0f, -1.0f, -2.0f
__m128 sign = _mm_set1_ps(-0.0f);      // sign = -0.0f, -0.0f, -0.0f, -0.0f
__m128 v2 = _mm_xor_ps(v1, sign);      //   v2 = -0.0f, -1.0f,  1.0f,  2.0f

因此,假设您想对数组中的所有值求反,您可以一次执行 4 个元素,如下所示:

const int N = 1024;
float a[N];
const __m128 sign = _mm_set1_ps(-0.0f);// sign = -0.0f, -0.0f, -0.0f, -0.0f
for (int i = 0; i < N; i += 4)
{
    v = _mm_loadu_ps(&a[i]);           // load 4 elements (unaligned) from a[]
    v = _mm_xor_ps(v1, sign);          // invert sign bit (i.e. negate)
    _mm_storeu_ps(&a[i], v);           // store 4 elements (unaligned) back to a[]
}
于 2012-05-28T20:15:39.047 回答