c++ - 如何使用KDTree对任意维度进行top-k查询和范围查询

Question

我曾经使用KD-tree(libkdtree++)来存储一个多维数据集，这里的要求是这个数据集可以支持不同维度的top-k/range查询。例如，KDTree<3, Point> 树：查找具有最高 Point[1]（y 轴）值的前 100 个点。

从 libkdtree++ 的实现来看，类似的是“find_within_range”函数，但是它是根据“曼哈顿距离”计算的，这里等于 max(x_dist, max(y_dist, z_dist))。如何只在一维上使用范围查询？

score 1 · Accepted Answer

查看代码，您似乎无法以直接的方式做到这一点，这太荒谬了。如果我是你，我会很想破解图书馆或编写我自己的 kd-tree。我会在他们的邮件列表中询问确定，但看起来你可能必须做这样的事情：

kdtreetype::_Region_ r(point_with_min_y);
r.set_low_bound(min_x, 0);
r.set_high_bound(max_x, 0);
r.set_low_bound(min_z, 2);
r.set_high_bound(max_z, 2);
r.set_high_bound((min_y + max_y) / 2, 1);

double search_min = min_y, search_max = max_y;

// binary search to get 100 points
int c;
while (c = tree.count_within_range(r) != 100) {
    if (c > 100) search_max = (search_min + search_max) / 2;
    else         search_min = (search_min + search_max) / 2;
    r.set_high_bound((search_min + search_max) / 2);
}

tree.visit_within_range(r, process_min_y_point);

这是对 Y 的一种非常低效的二分搜索，其中 count(y <= Y 的点) == 100。我不熟悉这个库，但这是我粗略检查时得到的最好的结果。

c++ - 如何使用KDTree对任意维度进行top-k查询和范围查询

1 回答 1

Related

Reference