我已经对连接到字符串的文件名列表进行了排序,并希望通过唯一的校验和来识别每个这样的字符串。
这些字符串的大小最小为 100 字节,最大为 4000 字节,平均为 1000 字节。字符串的总数可以是任何东西,但更有可能在 ca 的范围内。10000。
CRC-32 是否适合此目的?
例如,我需要以下每个字符串具有不同的固定长度(最好是短)校验和:
"/some/path/to/something/some/other/path"
"/some/path/to/something/another/path"
"/some/path"
...
# these strings can get __very__ long (very long strings are the norm)
CRC-32 哈希的唯一性是否会随着输入长度的增加而增加?
为此目的是否有更好的校验和选择?