在进行聚类之后,我最终得到了一个存储所有聚类标签的对象,如下所示:
clusterer.labels_
以上通常是列表或数组。然后我总是将标签分配给原始的熊猫数据框(数据集),如下所示:
df['cluster_lables] = cluster.labels_
最后我假设每个元素cluster.labels_
对应于我原始数据集的每一行,这个假设是否正确?例如,从上面的列创建中,我最终得到如下内容:
ColA ColB cluster_labels
1 3 -1
2 4 2
...
89 90 45