0

我一直在阅读一些关于降维的特征散列。我知道使用具有均匀输出分布的哈希函数(输入映射到特定值的机会与范围内的所有其他值相同)以及雪崩/级联效应(一个小输入的变化会产生很大的输出变化)。这些属性将确保要素之间的冲突独立于它们的频率。但是,我仍然不清楚雪崩效应(具体而言)如何影响这一点。谁能解释这里为什么/如何重要?什么构成产出的“大变化”?

参考资料: http: //blog.someben.com/2013/01/hashing-lang/ http://metaoptimize.com/qa/questions/6943/what-is-the-hashing-trick#6945

4

2 回答 2

0

这个想法是,如果您有一个紧密的输入数据集群,您仍然希望散列函数将输出分散到整个地图上。结果是碰撞将是一个统一的随机事件,而不是那个紧密的集群给你一连串的碰撞 - 或者与另一个紧密簇的映射发生一连串的碰撞。

“大变化”表明您的散列函数 h 应该表明 h(a) - h(b) 随机独立于 (ab)。

够了吗?如果您需要更多解释,请跟进。

于 2015-10-13T20:38:32.940 回答
0

雪崩效应确保输入的微小变化(例如:云与云)会在输出中产生很大的变化,也就是说,接近的输入值会产生遥远且不可预测的输出值。

于 2017-05-29T14:54:32.407 回答