我读了这个关于找到 3 维点的最近邻居的问题。八叉树是这种情况的解决方案。
kd-Tree是针对小空间(一般小于 50 维)的解决方案。
对于更高维度(数百维和数百万点的向量),LSH 是解决 AKNN(Aproxximate K-NN)问题的流行解决方案,如this question中所指出的。
然而,LSH 在 K-NN 解决方案中很受欢迎,其中 K>>1。例如,LSH 已成功用于基于内容的图像检索 (CBIR) 应用程序,其中每个图像都通过数百维的向量表示,数据集是数百万(或数十亿)张图像。在这种情况下,K 是与查询图像最相似的前 K 个图像的数量。
但是,如果我们只对高维空间中最近似的相似邻居(即 A1-NN)感兴趣怎么办?LSH 仍然是赢家,还是已经提出了临时解决方案?