对 KNN 而言,局部敏感散列似乎是一种很棒的技术,没有任何缺点。但是,如果有人在工业中将局部敏感散列用于实际应用,那么它的缺点是什么?LSH在什么情况下会失败或表现不佳?还是编码/调整需要很长时间?
问问题
782 次
1 回答
2
这是一个相当广泛的问题,但是由于您是新来的,我将尝试回答。
LSH 并不像你描述的那么完美,当然,请搜索有关它的论文。也许这个问题会有所帮助:如何理解局部敏感哈希?
有许多提供自动参数配置的 LSH 库,但不是最重要的R库,用于解决 R 近邻的随机版本。这是一个主要缺点,因为用户必须在每次输入时手动识别R。在我看来,在实际应用中,这是您必须考虑的一个非常重要的方面。
关于性能,这完全取决于您的输入!例如,在我的kd-GeRaF项目中,我对 LSH 进行了彻底的测试,我发现它在准确性和搜索速度方面可能存在一些重要问题。执行 ANNS 的高维空间中的数据集范围。
于 2015-12-11T17:11:50.583 回答