algorithm - 一种循环冗余校验算法，它对具有特定非零值的尾随字节数保持不变

Question

假设我有一个任意的字节块。该块以使用 CRC-16-CCITT 算法在整个块上计算的 CRC 余数终止，其中余数以大端字节序排列。在块和余数之后，有任意数量的零字节一直持续到字节流结束。

这种安排利用了这种 CRC 算法的某些特性，这通常被认为是不受欢迎的：它不区分具有不同数量尾随零的消息，前提是消息以其剩余部分终止（在我的情况下）。这允许接收器断言数据的正确性，而不管流中的尾随字节数如何。

这是一个例子：

>>> hex(crc(b'123456789'))                 # Computing the remainder
'0x29b1'
>>> hex(crc(b'123456789\x29\xb1'))         # Appending the remainder in the big-endian order
'0x0'                                      # If the remainder is correct, the residual value is always zero
>>> hex(crc(b'123456789\x29\xb1\x00\x00')) # ...and it is invariant to the number of trailing zeros
'0x0'
>>> hex(crc(b'123456789\x29\xb1\x00\x00\x00'))
'0x0'

在我的情况下，这是所需的行为。但是，在我的应用程序中，数据通过使用不归零 (NRZ) 编码的介质进行交换：介质层在相同级别的每五个连续数据位之后注入一个填充位，其中极性为填充位与前面的位相反；例如的值00000000被传输为000001000。位填充是非常不可取的，因为它会增加开销。

为了利用 CRC 算法对尾随数据（用于填充）的不变性并避免位填充，我打算将每个数据字节与 0x55 异或（尽管它可以是任何其他避免填充的位模式) 在更新 CRC 余数之前，然后将最终余数与 0x5555 异或。

作为参考，这里是标准的 CRC-16-CCITT 算法，简单的实现：

def crc16(b):
    crc = 0xFFFF
    for byte in b:
        crc ^= byte << 8
        for bit in range(8):
            if crc & 0x8000:
                crc = ((crc << 1) ^ 0x1021) & 0xFFFF
            else:
                crc = (crc << 1) & 0xFFFF
    return crc

这是我的修改，它使用 0x55 对输入和输出进行异或运算：

def crc16_mod(b):
    crc = 0xFFFF
    for byte in b:
        crc ^= (byte ^ 0x55) << 8
        for bit in range(8):
            if crc & 0x8000:
                crc = ((crc << 1) ^ 0x1021) & 0xFFFF
            else:
                crc = (crc << 1) & 0xFFFF
    return crc ^ 0x5555

一个简单的检查确认修改后的算法按预期运行：

>>> print(hex(crc16_mod(b'123456789')))         # New remainder
0x954f
>>> print(hex(crc16_mod(b'123456789\x95\x4f'))) # Appending the remainder; residual is 0x5555
0x5555
>>> print(hex(crc16_mod(b'123456789\x95\x4f\x55\x55\x55'))) # Invariant to the number of trailing 0x55
0x5555
>>> print(hex(crc16_mod(b'123456789\x95\x4f\x55\x55\x55\x55'))) # Invariant to the number of trailing 0x55
0x5555

我的问题如下：我是否通过引入这种修改来损害算法的错误检测特性？还有其他我应该注意的缺点吗？

score 1 · Accepted Answer

在标准错误模型下（位以固定概率独立翻转），没有缺点。很难预料实际的困难。

algorithm - 一种循环冗余校验算法，它对具有特定非零值的尾随字节数保持不变

1 回答 1

Related

Reference