从课程的幻灯片中,我发现了这些:
给定 R^D 中的集合 P 和查询点 q,它的 NN 是 P 中的点 p_0,其中:
dist(p_0, q) <= dist(p, q), for every p in P.
类似地,在近似因子 1 > ε > 0 的情况下,ε-NN 为 p_0,因此:
dist(p_0, q) <= (1+ε) * dist(p, q), for every p in P.
(我想知道为什么 ε 不能达到 1)。
我们构建了一个 KD-tree,然后我们使用这个算法搜索 NN: 就我的想法和测试而言,这是正确的。
我应该如何修改上述算法,以执行近似最近邻搜索 (ANNS)?
我的想法是将当前最佳值(在叶子中的更新部分)乘以 ε,并保持算法的其余部分不变。但是,我不确定这是否正确。有人可以解释吗?
PS - 我了解搜索 NN 的工作原理。
请注意,我在计算机科学网站上问过,但我什么也没得到!