4

我有一个数据集,我需要为它找到 K 个最近的邻居,或者距离 d 内的所有邻居。数据集定义了自定义距离,但它不是欧几里得距离。

我以前使用过度量树,主要是覆盖树。但是,在这种情况下,我的数据集将大于可用内存。那么,是否有任何数据结构可用于磁盘存储数据集上的最近邻?此操作的良好数据库索引也将很有用。

4

1 回答 1

1

您可以使用覆盖树来保存指向磁盘数据集的指针。指针将包含相对记录编号以及记录中允许您遍历树的任何附加信息。

于 2010-11-17T16:40:52.240 回答