1

我目前正在对来自 Kaggle 的银行营销数据集的分类属性进行聚类。我用 kmodes 创建了三个集群:

输出:cluster_df

现在我想将集群的每一行可视化为投影或点,以便获得某种图像:

所需的可视化

我很难做到这一点。我没有得到分类数据的欧几里得距离,对吧?这是没有意义的。那么是否有可能创建这种所需的可视化?

4

1 回答 1

1

可视化集群的最佳方法是使用 PCA。您可以使用 PCA 将多维数据减少为 2 维,以便您可以绘制并希望更好地理解数据。要使用它,请参阅以下代码:

from sklearn.decomposition import PCA
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame(data = principalComponents
             , columns = ['principal component 1', 'principal component 2'])

其中 x 是集群上的拟合和转换数据。现在您可以轻松地可视化您的集群数据,因为它是二维的。

于 2021-03-01T09:39:22.577 回答