我有大约 50 个位置,我想在空间上对它们进行集群,并且集群的大小是固定的。说以下几个位置。
lat<-c(17.48693,17.49222,17.51965,17.49359,17.49284,17.47077)
long<-c(78.38945,78.39643,78.37835,78.40079,78.40686,78.35874)
假设我想用集群大小对它们进行聚类 ~ 3
你能帮忙吗?
我有大约 50 个位置,我想在空间上对它们进行集群,并且集群的大小是固定的。说以下几个位置。
lat<-c(17.48693,17.49222,17.51965,17.49359,17.49284,17.47077)
long<-c(78.38945,78.39643,78.37835,78.40079,78.40686,78.35874)
假设我想用集群大小对它们进行聚类 ~ 3
你能帮忙吗?
您可以尝试使用kmeans
baseR 的一部分。这是一个针对 3 个中心的简单代码:
result <- kmeans(df, 3)
> result
K-means clustering with 3 clusters of sizes 4, 1, 1
Cluster means:
lat lng
1 17.49140 78.39838
2 17.47077 78.35874
3 17.51965 78.37835
Clustering vector:
[1] 1 1 3 1 1 2
请记住,不能保证您的数据可以很好地适合 kmeans 和 3 个中心。这轮 kmeans 导致 4 个观测值最终在一个集群中,而其他 2 个集群只有 1 个观测值。如果你对这次跑步不满意,你可以玩一会儿,直到你能集中精力找到合适的东西。
这是指向可能有帮助的教程的链接。
对于这样的微小数据,
您必须在哪里定义什么是“最佳”解决方案。