c++ - 处理低级字节操作时 reinterpret_cast 不好吗？

Question

我正在编写一个 websocket 服务器，我必须处理需要取消屏蔽的屏蔽数据。

掩码是 unsigned char[4]，数据也是 unsigned char* 缓冲区。

我不想逐字节异或，我更愿意一次异或 4 个字节。

uint32_t * const end = reinterpret_cast<uint32_t *>(data_+length);
for(uint32_t *i = reinterpret_cast<uint32_t *>(data_); i != end; ++i) {
    *i ^= mask_;
}

在这种情况下使用 reinterpret_cast 有什么问题吗？

替代方案是以下代码，它不那么清晰且不那么快：

uint64_t j = 0;
uint8_t *end = data_+length;
for(uint8_t *i = data_; i != end; ++i,++j) {
    *i ^= mask_[j % 4];
}

我对替代方案很感兴趣，包括依赖于 c++11 功能的替代方案。

score 8 · Accepted Answer

以下是发布的方法的一些潜在问题：

在某些类型大于char需要正确对齐才能访问的系统对象上。的一个典型要求uint32_t是对象与可被四整除的地址对齐。
如果length / sizeof(uint32_t) != 0循环可能永远不会终止。
根据系统的字节序mask需要包含不同的值。如果mask是由*reinterpret_cast<uint32_t>(char_mask)一个合适的数组产生的，那么它不应该是一个数组。

如果这些问题都处理好了，reinterpret_cast<...>(...)就可以在你有的情况下使用。重新解释指针的含义是该操作存在并且有时需要它的原因之一。不过，我会创建一个合适的测试用例来验证它是否正常工作，以避免在将代码移植到不同平台时不得不寻找问题。

就个人而言，我会采用不同的方法，直到分析显示它太慢：

char* it(data);
if (4 < length) {
    for (char* end(data + length - 4); it < end; it += 4) {
        it[0] ^= mask_[0];
        it[1] ^= mask_[1];
        it[2] ^= mask_[2];
        it[3] ^= mask_[3];
    }
}
it != data + length && *it++ ^= mask_[0];
it != data + length && *it++ ^= mask_[1];
it != data + length && *it++ ^= mask_[2];
it != data + length && *it++ ^= mask_[3];

我肯定在软件中使用了许多类似的方法，这些方法意味着更快，并且没有发现它们是一个显着的性能问题。

score 2 · Accepted Answer

reinterpret_cast在这种情况下没有什么特别的错误。但是，保重。

现有的 32 位循环是不正确的，因为它不适合有效负载大小不是 32 位倍数的情况。我想有两种可能的解决方案：

在 for 循环检查中替换!=with <（人们使用是有原因的<，而不是因为他们很笨......）并按字节执行尾随 1-3 个字节
安排缓冲区，使有效负载部分的缓冲区大小是 32 位的倍数，并对额外的字节进行异或。（大概代码在向调用者返回字节时会检查有效负载长度，所以这无关紧要。）

此外，根据代码的结构，您可能还必须处理某些 CPU 的未对齐数据访问。如果您在 32 位对齐的缓冲区中缓冲了整个帧、标头和所有内容，并且有效负载长度小于 126 字节或 >65,535 字节，则掩码键和有效负载都将未对齐。

不管它值多少钱，我的服务器使用类似于第一个循环的东西：

for(int i=0;i<n;++i)
    payload[i]^=key[i&3];

与 32 位选项不同，这基本上是不可能出错的。

c++ - 处理低级字节操作时 reinterpret_cast 不好吗？

2 回答 2

Related

Reference