我有一个数据集,我需要为它找到 K 个最近的邻居,或者距离 d 内的所有邻居。数据集定义了自定义距离,但它不是欧几里得距离。
我以前使用过度量树,主要是覆盖树。但是,在这种情况下,我的数据集将大于可用内存。那么,是否有任何数据结构可用于磁盘存储数据集上的最近邻?此操作的良好数据库索引也将很有用。
我有一个数据集,我需要为它找到 K 个最近的邻居,或者距离 d 内的所有邻居。数据集定义了自定义距离,但它不是欧几里得距离。
我以前使用过度量树,主要是覆盖树。但是,在这种情况下,我的数据集将大于可用内存。那么,是否有任何数据结构可用于磁盘存储数据集上的最近邻?此操作的良好数据库索引也将很有用。