我目前正在对来自 Kaggle 的银行营销数据集的分类属性进行聚类。我用 kmodes 创建了三个集群:
输出:cluster_df
现在我想将集群的每一行可视化为投影或点,以便获得某种图像:
我很难做到这一点。我没有得到分类数据的欧几里得距离,对吧?这是没有意义的。那么是否有可能创建这种所需的可视化?
我目前正在对来自 Kaggle 的银行营销数据集的分类属性进行聚类。我用 kmodes 创建了三个集群:
输出:cluster_df
现在我想将集群的每一行可视化为投影或点,以便获得某种图像:
我很难做到这一点。我没有得到分类数据的欧几里得距离,对吧?这是没有意义的。那么是否有可能创建这种所需的可视化?
可视化集群的最佳方法是使用 PCA。您可以使用 PCA 将多维数据减少为 2 维,以便您可以绘制并希望更好地理解数据。要使用它,请参阅以下代码:
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame(data = principalComponents
, columns = ['principal component 1', 'principal component 2'])
其中 x 是集群上的拟合和转换数据。现在您可以轻松地可视化您的集群数据,因为它是二维的。