我一直在阅读一些关于降维的特征散列。我知道使用具有均匀输出分布的哈希函数(输入映射到特定值的机会与范围内的所有其他值相同)以及雪崩/级联效应(一个小输入的变化会产生很大的输出变化)。这些属性将确保要素之间的冲突独立于它们的频率。但是,我仍然不清楚雪崩效应(具体而言)如何影响这一点。谁能解释这里为什么/如何重要?什么构成产出的“大变化”?
参考资料: http: //blog.someben.com/2013/01/hashing-lang/ http://metaoptimize.com/qa/questions/6943/what-is-the-hashing-trick#6945