1

我正在尝试为我的 PH 树索引实现矩形范围查询,我有以下问题:

  1. 查看现有实现,所有存储的数据似乎都是点数据(与由左下角或右上角定义的矩形/长方体/...相反)。真的吗?或者我如何从关系中判断我是否存储点和矩形以及从哪里可以获得矩形的左上角?
  2. 是否有一种查询类型只返回位于矩形中的所有点(或返回与给定查询矩形相交的所有矩形)?我查看了RangeQuery,但从文档中它似乎返回给定范围的最近邻居。同样,其他实现DatabaseQuery似乎不支持这个标准查询。
  3. 有没有办法让现有的测试来验证我的实现?IndexFactory@apiviz注释实现一个就足够了吗?
  4. 也许有点跑题了:我找不到 ELKI 邮件列表。该网站提到更新和新闻的“用户邮件列表”,但从 LMU 外部注册被阻止。该网站还提到了一个社区邮件列表,但我找不到链接,有人可以在这里发布吗?
4

1 回答 1

1
  1. ELKI 中的关系具有类型信息。

    如果类型是 a NumberVector,那么它是点数据。我们还没有很多用于存储矩形的用例,但是您可以编写索引以便它可以与 eg 一起使用SpatialComparable(本质上是任何类型的边界框)。

  2. 目前还没有矩形窗口查询的查询类型,但是可以使用中心和加权最大范数来模拟这些查询类型。ELKI 中可能只有一种或两种使用矩形查询的数据挖掘算法。大多数可以使用索引加速的数据挖掘算法似乎要么使用半径搜索,要么使用 kNN 搜索。

  3. 最好的测试方法是支持标准范围和 knn 查询,然后运行例如 DBSCAN 聚类和 LOF 异常值检测。如果你为它实现了 aIndexFactory和 a Parameterizer(所以它可以在 MiniGUI 中配置)那么这应该很容易测试。

    @apiviz注释仅用于 JavaDoc,我们一直在考虑转移到用于 UML 图的不同工具。

  4. 抱歉,目前无法访问邮件列表注册页面;系统管理员似乎有一个未解决的安全问题。我已经更新了网页,说明如何通过电子邮件订阅。

于 2015-08-03T21:54:22.187 回答