我想创建一个包含大量文件校验和的数据库,并且我担心校验和冲突(具有相同校验和的两个不同文件)。
问题1:两个不同文件具有相同MD5和的概率是多少?
作为一种解决方法,我考虑使用增加的校验和。从一个小的校验和开始,如果发生冲突,计算一个更大的校验和,该校验和可以导出到较小的校验和,所以我不必重新计算数据库中已经存在的所有文件的校验和......我仍然想成为能够搜索更小尺寸的校验和。
问题 2:哪种校验和/摘要算法可以做到这一点?我需要一个校验和算法,它可以计算一定大小的值并且“向后”兼容(较小的大小)。IE。file1 有一个 2 字节校验和 0x1234 和一个 4 字节校验和 0x12345678,2 字节校验和可以从 4 字节校验和导出。