我想知道在任何 SIMD 指令系列中是否可以执行以下操作。
我有一个 63 位有效位(从不为负)的 qword 输入。从 LSB 开始的每个连续 7 位都随机对齐到一个字节,左填充为 1(除了最重要的非零字节)。为了说明,为了清楚起见,我将使用字母。
结果只有重要字节,因此大小为 0 - 9,它被转换为字节数组。
In: 0|kjihgfe|dcbaZYX|WVUTSRQ|PONMLKJ|IHGFEDC|BAzyxwv|utsrqpo|nmlkjih|gfedcba
Out: 0kjihgfe|1dcbaZYX|1WVUTSRQ|1PONMLKJ|1IHGFEDC|1BAzyxwv|1utsrqpo|1nmlkjih|1gfedcba
尺寸 = 9
In: 00|nmlkjih|gfedcba
Out: |0nmlkjih|1gfedcba
大小 = 2
我明白填充是分开的。洗牌对齐是我的问题。这可能吗?
编辑 2
这是我更新的代码。在单线程 Core 2 Duo 2 GHz,64 位上获得持续 46 M / sec 的随机长度输入。
private static int DecodeIS8(long j, ref byte[] result)
{
if (j <= 0)
{
return 0;
}
int size;
// neater code: gives something to break out of
while (true)
{
result[0] = (byte)((j & 0x7F) | 0x80);
size = 0;
j >>= 7;
if (j == 0) break;
result[1] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[2] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[3] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[4] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[5] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[6] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[7] = (byte)((j & 0x7F) | 0x80);
size++;
j >>= 7;
if (j == 0) break;
result[8] = (byte)j;
return 9;
}
result[size] ^= 0x80;
return size + 1;
}