-1

我有 1000 个地理点(纬度、经度)作为起点/终点。还有一个历史数据显示了一些 OD 对之间的旅行成本。对于某些 O-D,数据集中没有记录,而有些则有多个成本不同的记录(例如,由于季节性)。

我想将这 1000 个点聚集到几个集群(例如 20 个)中,不仅基于它们的位置(纬度、经度),还考虑到平均旅行成本和共享目的地点。

如果您对聚类这些数据有任何建议,我将不胜感激。

4

1 回答 1

0

您必须以某种方式处理缺失值 - 为它们分配一些给定的标签或取一些平均值/中值。然后你可以使用任何你想要的算法(不同类型的特征可以一起用作算法的输入)

如果数据的维度不多,并且您或多或少地知道可能有多少簇,则 k-means 算法应该可以很好地工作。

如果您想在 2d 和 3d 上可视化数据和集群,并且您将拥有更多功能,则必须应用降维(PCA,t-SNE)。

于 2017-10-23T07:24:47.533 回答