1

我对 R 相当陌生,我希望很好地可视化我的 368k 客户的 k-means 细分,其中 36 个变量分为 6 个细分。

为此,我相信我需要先对数据集进行 MDS 才能绘制它,但我似乎总是遇到同样的问题,即 R 无法分配该大小的向量长度。

我一直在研究其他方法,例如 NMDS,但仍然遇到类似的问题。想知道是否甚至可以将缩放值存储为向量以外的其他东西作为解决方法?

意识到这可能太大而无法可视化,而且可能甚至不值得这样做。

欢迎任何提示或指导。

我尝试使用的代码是:

d=dist(MyData, method = "euclidean")

这给了我“错误:无法分配大小为 1.4 Mb 的向量”消息

然后我打算使用以下代码来拟合和绘制图形:

fit=cmdscale(d,eig=TRUE, k=2)
p = ggplot(data.frame(MyData), aes(fit$points[,1], fit$points[,2], color =  factor(Kmeans$cluster))) 
p <- p + theme(axis.title.y = element_text(size = rel(1.5), angle = 90))
p <- p + theme(axis.title.x = element_text(size = rel(1.5), angle = 00))
p= p + theme(axis.text=element_text(size=16,angle=90),axis.title=element_text(size=20,face="bold")) + geom_point(size=4)
p= p + theme(legend.text = element_text(size = 14, colour = "black"))
p= p + theme(legend.title = element_text(size = 18, colour = "black"))
p= p  + theme(legend.key.size = unit(1.5, "cm"))
p
4

0 回答 0