2

我正在尝试优化我的一段运行 CRC32 检查的代码。

对于测试缓冲区,我执行了以下操作:

char *buff = new char[1024];
for (int i = 0; i < 1024; ++i)
    buff[i] = i;

目前,我正在使用 boost 的 crc 实现,如下所示:

boost::crc_optimal<32, 0x1EDC6F41, 0, 0> crc;
crc.process_bytes(buff, 1024);
unsigned int boostCRC = crc();

这意味着多项式“0x1EDC6F41”,初始值为 0,最终异或为 0。

然后,我编写了最简单的 sse4.2 版本的 crc32c 算法:

unsigned int sseCRC = 0;
for (char *iter = buff, *end = buff + 1024; iter != end; ++iter)
    sseCRC = _mm_crc32_u8(sseCRC, *iter);

问题是,即使多项式应该相同,最终值也不匹配。有没有人有这方面的经验?我对 sse 版本做错了吗?

4

1 回答 1

4

根据英特尔® SSE4 编程参考,CRC 指令执行位反射,在 boost CRC 模板中默认关闭。使用

boost::crc_optimal<32, 0x1EDC6F41, 0, 0, true, true> crc;

代替

boost::crc_optimal<32, 0x1EDC6F41, 0, 0> crc;

将产生与 SSE 版本相同的校验和。

于 2013-05-18T10:19:07.190 回答