0

我是 R 的菜鸟,我正在尝试对一些数据样本进行聚类。我试过PCA,

res.pca <- PCA(df, 
               ncp = 5, # nb composantes principales.
               graph = TRUE,
               )

我可以使用新坐标获取完整的元素列表

res.pca$ind

这很棒,非常适合使用带有 PCA 的第 2 个轴的信息,我在一个轴上有 80% 的可变性,在第二个轴上有超过 10% 的可变性。考虑到我有 30 个变量,我对结果感到非常自豪......最后 PCA 暗示说二维就足够了。

仍在处理这些数据,我尝试了 DBSCAN 聚类方法fpc::dbscan

library (factoextra)
db <- fpc::dbscan(df, eps = 22, MinPts = 3)

在执行 dbscan 并使用 fviz_cluster 绘制集群后,二维显示显示:轴 1 上为 92.8%,轴 2 上为 6.7%!!!!(超过 99% 的总方差用 2 轴解释!

简而言之,DBSCAN 以一种看起来比 PCA 更好的方式转换了我的 30 个变量数据。DBSCAN 的整体聚类对我的数据来说是垃圾,但已经使用的转换绝对出色。

我的问题是我想访问这些新坐标......但目前没有办法......我能看到的唯一可访问变量是: db$cluster, db$eps, db$Minpts, db$isseed

但我怀疑某些数据是可以访问的,否则 fviz_cluster 可以呈现数据。

任何想法 ?

4

1 回答 1

2

投影不是由 dbscan 完成的。fviz_cluster使用通过stats::prcomp数据获得的前两个组件。

于 2017-11-05T04:34:36.233 回答