-3

我有集群。它们是手动完成的。我知道机器学习算法旨在有效地分割配置文件,但我不会放弃我拥有的集群。我只想稍微改变它们以使它们相关。当然,结果不会像 K-means 输出那么好。您是否知道任何来自现有集群并尝试优化/纠正它们的方法?非常感谢

4

1 回答 1

0

对于所有实际目的,自动集群往往比您手动标记的任何内容更糟糕。

所以我认为你不需要“优化”它们。

但是有一些明显的方法:

  • 对于 KMeans 和 PAM 等方法,您可以使用手动集群作为初始质心。只要确保它们不会退化...
  • 有约束聚类算法,您可以在其中使用现有标签作为约束,并让聚类算法找到具有最佳一致性的解决方案。

但不要高估聚类。它对参数、预处理、归一化非常敏感,...... - 它不是那么可靠。

于 2018-06-09T12:01:13.853 回答