sklearn中的K-means聚类,聚类的数量是预先知道的(它是2)。有多种功能。特征值最初没有分配任何权重,即它们被同等加权。然而,任务是为每个特征分配自定义权重,以获得最佳的聚类分离。如何确定每个特征的最佳样本权重(sample_weight),以获得两个集群的最佳分离?如果这对于 k-means 或 sklearn 是不可能的,我对任何替代聚类解决方案感兴趣,关键是我需要自动确定多元特征的适当权重的方法,以最大化聚类分离。
问问题
259 次