我是 R 的菜鸟,我正在尝试对一些数据样本进行聚类。我试过PCA,
res.pca <- PCA(df,
ncp = 5, # nb composantes principales.
graph = TRUE,
)
我可以使用新坐标获取完整的元素列表
res.pca$ind
这很棒,非常适合使用带有 PCA 的第 2 个轴的信息,我在一个轴上有 80% 的可变性,在第二个轴上有超过 10% 的可变性。考虑到我有 30 个变量,我对结果感到非常自豪......最后 PCA 暗示说二维就足够了。
仍在处理这些数据,我尝试了 DBSCAN 聚类方法fpc::dbscan
:
library (factoextra)
db <- fpc::dbscan(df, eps = 22, MinPts = 3)
在执行 dbscan 并使用 fviz_cluster 绘制集群后,二维显示显示:轴 1 上为 92.8%,轴 2 上为 6.7%!!!!(超过 99% 的总方差用 2 轴解释!
简而言之,DBSCAN 以一种看起来比 PCA 更好的方式转换了我的 30 个变量数据。DBSCAN 的整体聚类对我的数据来说是垃圾,但已经使用的转换绝对出色。
我的问题是我想访问这些新坐标......但目前没有办法......我能看到的唯一可访问变量是:
db$cluster, db$eps, db$Minpts, db$isseed
但我怀疑某些数据是可以访问的,否则 fviz_cluster 可以呈现数据。
任何想法 ?