2

我正在为空间索引构建 Morton 数,我有 8 个无符号 16 位数,它们将变成 __int128 数。效率至关重要,因此天真的解决方案(循环遍历所有内容)或构建单独的 8 个 128 位数字太昂贵了。

我正在使用 GCC,目标机器是 64 位但不支持 BMI2。

如何加快计算速度?

4

1 回答 1

3

movmsk如果您的机器是 x86 并且支持 SSE2,那么使用说明会有一个聪明的答案。谷歌SSE2 bit matrix transpose获取完整代码。

于 2017-06-15T05:50:24.353 回答