5

k-means 聚类算法是否总是产生相同的解决方案?初始化应该是随机的,那么无论初始化如何,聚类都会收敛到相同的结果吗?

4

2 回答 2

5

初始化应该是随机的,那么无论初始化如何,聚类都会收敛到相同的结果吗?

恰恰相反。如果k均值问题是一个很好的凸优化问题,我们就不会随机初始化它,因为简单地从 (0,0,...,0) 开始就会给出正确的答案。

随机初始化的原因正是您可以通过尝试不同的随机种子来获得不同的解决方案,然后在所有k均值运行完成后选择最好的解决方案。对于许多应用程序来说,十次运行是一个很好的经验法则。

找到k均值问题的全局最小值通常是NP 难的。通用算法实际上是一种启发式算法。

于 2014-01-21T14:11:44.400 回答
3

实际上k-means算法的初始化对得到的结果有明显的影响。为了防止“错误”初始化,您可以求助于克服这个问题的 k-means++ 算法。您可以在维基百科 ( http://en.wikipedia.org/wiki/K-means%2B%2B )中查看这一点。

于 2014-01-23T14:19:02.720 回答