Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我见过许多哈希算法有一个共同的特点,就是数据的任何变化都会产生哈希码的总变化,虽然是这样,但我想知道是否有任何已知的标准哈希算法具有不同的行为,对于数据的微小变化,哈希变化很小,哈希变化量与数据变化量之间的一种近似线性关系。
这样做的一个想法是创建一个连接从部分数据计算的各种散列的散列,它会使用小的部分散列,或者更大的最终散列,无论如何,我想知道是否有任何算法具有这种行为。
我认为您正在寻找类似 Simhash 的东西。它实际上是为了寻找“接近重复”。
例如http://irl.cs.tamu.edu/people/sadhan/papers/cikm2011.pdf