我在 python 中对我的数据应用 meanshift 聚类,目的是用这个算法进行预测。
在进行 meanshift 之后,我得到了 45 个带有bandwidth=6.5
.
clustering = MeanShift(bandwidth=6.5, n_jobs=20).fit(first_data)
labels=clustering.labels_
print(np.asarray(np.unique(labels, return_counts=True)).T)
这变成了 45 个标签。当我使用fit_predict()
和predict()
函数将我的第二个数据聚类到这 45 个聚类中时,我得到了 55 个带有 clustering.fit_predict(second_data)
和clustering.predict(second_data)
结尾的标签。
为什么会这样?如何将我的第二个数据聚类到来自第一个算法的 45 个聚类中?谢谢您的帮助。