我正在研究一个涉及文件哈希计算的项目。该项目就像一个文件备份服务,所以当一个文件从客户端上传到服务器时,我需要检查该文件是否已经在服务器中可用。我为文件生成一个 CRC-32 哈希,然后将哈希发送到服务器以检查它是否已经可用。
如果文件不在服务器中,我曾经将文件作为 512 KB 块 [for Dedupe] 发送,我必须为每个 512 KB 块计算哈希。文件大小有时可能只有几 GB,并且多个客户端将连接到服务器。所以我真的需要一个快速和轻量级的文件散列算法。有任何想法吗 ..?
PS:我已经注意到 StackOverflow 中的一些 Hashing Algorithm 问题,但答案并不能完全比较此类任务所需的 Hashing Algorithms。我敢打赌这对一群人来说真的很有用。