我已经有了生成局部敏感散列的算法,但是我应该如何将它们存储起来以利用它们的特性(即相似的元素具有接近散列(具有汉明距离))?
在 matlab 代码中,我发现他们只是在要搜索的点的散列和数据库中点的散列之间创建一个距离矩阵,以简化代码,同时引用所谓的 Charikar 方法来实现搜索的实际良好方法。
我试图搜索它,但我不确定如何将我找到的任何方法应用于我的案例(如多探针方法)。如果您已经拥有哈希值,那么这些技术似乎都不是很容易插入的。是否有任何简单的示例代码?或者有什么建议?
这是我正在谈论的带有 matlab 代码的页面的链接: http ://www.eecs.berkeley.edu/~kulis/klsh/klsh.htm