c - SSE 移位整数

Question

我试图了解如何使用 SSE 进行转换，但我不明白 gdb 给我的输出。使用 SSE4 我有一个 128 位向量，其中包含 8 个 16 位无符号整数（使用uint16_t）。然后我使用内在函数_mm_cmpgt_epi16将它们与某个值进行比较，该函数将所有 0 或 1 位放入用于存储整数的位中。到目前为止一切顺利，使用 gdb 我得到：

(gdb) p/t sse_res[0]
$3 = {1111111111111111111111111111111111111111111111110000000000000000, 1111111111111111111111111111111111111111111111110000000000000000}

然后我想把它们移到右边（对吗？）所以我只得到一个数值 1 以防万一。然后 GDB 给了我一个我不明白的输出：

(gdb) p/t shifted
$4 = {11101000000000010010000000000000110000000000000000011, 100111000000000001011000000000001001000000000000001111}

它甚至与第一个长度不一样，这是为什么呢？只是为了尝试一下，我使用以下内在函数将其向右移动一位：

shifted = _mm_srli_epi16(sse_array[i], 1);

我希望它在每个 16 位块的右端只移动一个零。

更新：

我写了一个小例子来测试使用位掩码的东西，它工作正常，但我仍然不明白 gdbs 的行为：

#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <stdint.h>

#include <tmmintrin.h> 
#include <smmintrin.h>

void print128_num(__m128i vector)
{
    uint16_t *values = (uint16_t*) &vector;
    printf("Numerical: %i %i %i %i %i %i %i %i \n", 
           values[0], values[1], values[2], values[3], values[4], values[5], 
           values[6], values[7]);
}

int main (int argc, char **argv)
{
    uint16_t nums[] = {1, 57, 33, 22, 88, 99, 9, 73};

    __m128i *nums_sse = (__m128i*)(&nums);
    print128_num(*nums_sse);

    // vector of 42
    __m128i mm42 = _mm_set1_epi16(42);

    __m128i sse_res = _mm_cmpgt_epi16(*nums_sse, mm42);
    printf("Result of the comparison\n");
    print128_num(sse_res);

    // bitmask
    __m128i mask = _mm_set1_epi16(1);

    __m128i finally = _mm_and_si128(sse_res, mask);
    printf("Result of the masking\n");
    print128_num(finally);

    uint16_t* sse_ptr = (uint16_t*)(&finally);

    uint32_t result = sse_ptr[0] + sse_ptr[1] + sse_ptr[2] + sse_ptr[3]
                    + sse_ptr[4] + sse_ptr[5] + sse_ptr[6] + sse_ptr[7];

    printf("Result: %i numbers greater 42\n", result);

    return 0;
}

Breakpoint 1, main (argc=1, argv=0x7fff5fbff3b0) at example_comp.c:44
44      printf("Result: %i numbers greater 42\n", result);
(gdb) p/t sse_res
$1 = {11111111111111110000000000000000, 1111111111111111000000000000000011111111111111111111111111111111}
(gdb) p/t mask
$2 = {1000000000000000100000000000000010000000000000001, 1000000000000000100000000000000010000000000000001}
(gdb) p/t finally
$3 = {10000000000000000, 1000000000000000000000000000000010000000000000001}
(gdb) p result
$4 = 4
(gdb)

我的 gdb 版本：GNU gdb 6.3.50-20050815 (Apple version gdb-1472) (Wed Jul 21 10:53:12 UTC 2010)

编译器标志：-Wall -g -O0 -mssse3 -msse4 -std=c99

score 2 · Accepted Answer

我不明白你在这里想要做什么，但也许你可以为我们澄清一下。

因此，您在两个变量中的每一个中都包含 8个有符号整数，您可以测试它们是否大于。结果看起来表明前 3 个更大，下一个不是，接下来的 3 个更大，最后一个不是。（_mm_cmpgt_epi16 在我找到的参考文献中假设有符号整数。）

然后您想判断“它”是否为真，但我不确定您的意思。你的意思是他们都更伟大？（如果是这样，那么您可以将结果与 MAX_VALUE 或 -1 或类似的东西进行比较。）

但最后一步是将一些数据分段向右移动。请注意，它与 sse_res[0] 不同。您是否希望换掉那个？

在不知道移位前数据中的内容的情况下，我们无法判断它是否正常工作，但我假设 gdb 在其输出中省略了前导零，这可以解释较短的结果。

0000000000011101    29    was 58 or 59
0000000000100100    36    was 72 or 73
0000000000011000    24    was 48 or 49
0000000000000011     3    was  6 or  7
0000000000100111    39    was 78 or 79
0000000000010110    22    was 44 or 45
0000000000100100    36    was 72 or 73
0000000000001111    15    was 30 or 31

这些数字是不是很眼熟？

更新：

感谢您更新的代码。它看起来整数以相反的顺序打包，并且在 gdb 输出中留下了前导零。

c - SSE 移位整数

1 回答 1

Related

Reference