1

我使用“列表中位数”算法在 Java 中编写了一个 KD-Tree,以构建一个更平衡的树。使用 wiki 提供的数据时似乎工作正常,请注意 wikipedia 示例仅使用 X、Y 值,因此它不评估 Z 深度。

来自维基百科:

point_list = [(2,3), (5,4), (9,6), (4,7), (8,1), (7,2)]

在此处输入图像描述

我的java程序

depth=0 id=(7.0, 2.0, 0.0)
├── [left] depth=1 id=(5.0, 4.0, 0.0)
│   ├── [left] depth=2 id=(2.0, 3.0, 0.0)
│   └── [right] depth=2 id=(4.0, 7.0, 0.0)
└── [right] depth=1 id=(9.0, 6.0, 0.0)
    └── [left] depth=2 id=(8.0, 1.0, 0.0)

但是,当我对这些数据使用“列表中位数”方法时,它似乎无法正常工作。

point list = [(1,0,-1), (1,0,-2), (1,0,1), (1,0,2)]

我得到一棵这样的树:

depth=0 id=(1.0, 0.0, 1.0)
├── [left] depth=1 id=(1.0, 0.0, -2.0)
│   └── [left] depth=2 id=(1.0, 0.0, -1.0)
└── [right] depth=1 id=(1.0, 0.0, 2.0)

这看起来不正确,因为 (1.0, 0.0, 2.0) 在 (1.0, 0.0, 1.0) 的右侧,但它们本质上是相等的,因为它们的 Y 值相等。此外, (1.0, 0.0, -1.0) 在 (1.0, 0.0, -2.0) 的左侧,它应该在右侧,因为它的 Z 值更大。

我认为问题源于具有相等的 X 和 Y 值并且只有可变的 Z 值,因此列表的中位数并没有真正准确地拆分列表。

...遵循wiki的python代码的原始代码...

private static KdNode createNode(List<XYZPoint> list, int k, int depth) {
    if (list == null || list.size() == 0) return null;

    int axis = depth % k;
    if (axis == X_AXIS) Collections.sort(list, X_COMPARATOR);
    else if (axis == Y_AXIS) Collections.sort(list, Y_COMPARATOR);
    else Collections.sort(list, Z_COMPARATOR);

    KdNode node = null;
    if (list.size() > 0) {
        int mediaIndex = list.size() / 2;
        node = new KdNode(k, depth, list.get(mediaIndex));
        if ((mediaIndex - 1) >= 0) {
            List<XYZPoint> less = list.subList(0, mediaIndex);
            if (less.size() > 0) {
                node.lesser = createNode(less, k, depth + 1);
                node.lesser.parent = node;
            }
        }
        if ((mediaIndex + 1) <= (list.size() - 1)) {
            List<XYZPoint> more = list.subList(mediaIndex + 1, list.size());
            if (more.size() > 0) {
                node.greater = createNode(more, k, depth + 1);
                node.greater.parent = node;
            }
        }
    }

    return node;
}

...基于我的评论的新代码...

private static KdNode createNode(List<XYZPoint> list, int k, int depth) {
    if (list == null || list.size() == 0) return null;

    int axis = depth % k;
    if (axis == X_AXIS) Collections.sort(list, X_COMPARATOR);
    else if (axis == Y_AXIS) Collections.sort(list, Y_COMPARATOR);
    else Collections.sort(list, Z_COMPARATOR);

    KdNode node = null;
    if (list.size() > 0) {
        int medianIndex = list.size() / 2;
        node = new KdNode(k, depth, list.get(medianIndex));
        List<XYZPoint> less = new ArrayList<XYZPoint>(list.size()-1);
        List<XYZPoint> more = new ArrayList<XYZPoint>(list.size()-1);
        //Process list to see where each non-median point lies
        for (int i=0; i<list.size(); i++) {
            if (i==medianIndex) continue;
            XYZPoint p = list.get(i);
            if (KdNode.compareTo(depth, k, p, node.id)<=0) {
                less.add(p);
            } else {
                more.add(p);
            }
        }
        if (less.size() > 0) {
            node.lesser = createNode(less, k, depth + 1);
            node.lesser.parent = node;
        }
        if (more.size() > 0) {
            node.greater = createNode(more, k, depth + 1);
            node.greater.parent = node;
        }
    }
4

2 回答 2

2

问题确实与相等的坐标有关,并且源于您如何将节点分成lessmore部分。既然你有中位数索引,为什么不使用索引来分割而不是检查坐标呢?只需将第createNode116 行中的条件从

if (KdNode.compareTo(depth, k, p, node.id)<=0) {

if (i<medianIndex) {

顺便说一句:与排序相比,有更有效的算法将列表划分为下、中、上。(下部和上部不需要排序!参见例如std::nth_elementC++ stdlib 中的实现 - 抱歉,我非常喜欢 Java 编程)

于 2012-11-22T17:59:11.243 回答
0

我认为此时的基本问题是:您到底想用 KD-tree 做什么?

  • 如果您只想使用 X 和 Y 距离找到最近的点,那么您拥有的算法非常好 - 您将找到与您的示例具有相等 XY 距离的四个点中的至少一个。
  • 如果你想在 XY 距离中找到所有最近的点,那么仍然保持 KD-tree 构建函数相同,但只需将查找函数中的所有 '<' 运算符更改为 '<='。如果您恰好在查询点找到一个 KD-tree 点,您仍然需要沿着该树的任意子节点下降,直到找到一个叶子。然后像往常一样在 KD-tree 中上树,如果它可能与您迄今为止找到的最短距离相匹配,则总是沿着兄弟树向下。
  • 如果您想使用涉及 X、Y 和 Z 坐标的距离,您需要使您的树成为 3 维 KD 树,其中 X、Y 和 Z 层交替(或者可能有一些聪明的选择下一步细分哪个维度的方案)。
于 2012-11-22T20:36:07.003 回答