1

假设我已经根据一组哈希构建了一个 LSH 数据库,我现在开始查询数据库以找到近似的最近邻居。

当您计算查询点的哈希并且相应的存储桶为空时,是否有任何指导方针?同样,假设我想找到 5 个近似最近的邻居,而桶只有 4 个其他数据点?

4

1 回答 1

1

我相信检索的分数太少意味着你有太多的桶来存储你的训练数据。当然,这取决于应用程序。看看Greg Shakhnarovich 的 LSH 工具箱实现和他的README 文件。在这个实现中,更少的哈希函数(更小的 k)意味着更满的桶,而这反过来意味着更慢的 LSH。

于 2017-02-09T15:24:25.730 回答