1

我需要检查一张图片是否已经包含在一大组图片中(超过 200 万张图片)。因此,我使用 md5 作为散列函数实现了一个持久散列列表。后来,我读到 md5 有一些问题,并且开发了更好的功能。你认为我的目的有更好的功能吗?

4

1 回答 1

2

不要将 MD5 用于安全性很重要的任何事情。MD5

对于简单的重复检测,您应该没问题。(您的场景中没有攻击者)

如果您的代码有可能在需要安全的环境中使用,请使用安全的替代方案。SHA-265是一个很好的候选者。Git 使用 SHA-1,但你不应该将它用于新应用程序

一个快速的非加密散列函数是MurmurHash。如果您需要最高性能,请使用此选项。

于 2012-08-23T12:39:32.313 回答