2

作为上一个问题的后续行动:

假设您有一个 uint64_t 并且只关心uint64_t. 像这样:

0111.1111 0111.1111 0111.1111 0111.1111 0111.1111 0111.1111 0111.1111 0111.1111

--->

0000.0000 1111.1111 1111.1111 1111.1111 1111.1111 1111.1111 1111.1111 1111.1111

有没有比屏蔽每个部分、右移并添加到下一个更快的方法来将每个 7 位部分向右移动?

不幸的是,我没有允许快速和通用位收集的热门 AVX 指令。我只能访问 SSE2 指令。

4

1 回答 1

3

你可以用三个面具和班次来做到这一点。

u64 val;

// remove bits at 7, 23, 39, 47
u64 odd8   = val & 0x7f007f007f007f00L;
u64 even8  = val & 0x007f007f007f007fL;

val = ( odd8 >> 1 ) | even8;

// remove bits at 15-16, 23-24
u64 odd16  = val & 0x3FFF00003FFF0000L;
u64 even16 = val & 0x00003FFF00003FFFL;

val = ( odd16 >> 2 ) | even16;

// remove bits at 31-35
u64 odd32  = val & 0x0FFFFFFF00000000L;
u64 even32 = val & 0x000000000FFFFFFFL;

val = ( odd32 >> 4 ) | even32;
于 2012-08-30T18:46:07.683 回答