我有来自 5 到 6 个不同来源的数千到一万个数据点 (x,y)。我需要根据一定的距离标准对它们进行唯一分组,这样形成的组应该只包含来自每个源的一个输入,并且组中的每个输入都应该在一定的距离 d 内。组成的组应该是最好的匹配。
- 这是聚类和最近邻居的组合吗?
- 对算法有什么建议?
- 有没有可用的开源代码?
我看到很多参考资料都说 KD 树实现和 k-clustering 等。我不确定如何根据这个特定需求进行定制。
我有来自 5 到 6 个不同来源的数千到一万个数据点 (x,y)。我需要根据一定的距离标准对它们进行唯一分组,这样形成的组应该只包含来自每个源的一个输入,并且组中的每个输入都应该在一定的距离 d 内。组成的组应该是最好的匹配。
我看到很多参考资料都说 KD 树实现和 k-clustering 等。我不确定如何根据这个特定需求进行定制。