2

我想知道我可以将什么样的种子选择方法应用于 K-means 算法。谷歌搜索没有那么有用。有什么建议么?

4

2 回答 2

2

种子取决于域。例如,如果您的数据项是单词,那么您的种子应该是最常见的单词。否则,您可以聚集一个小样本并将其用作种子。

下面是一个更复杂的算法示例:

k-Means 的单通道种子选择算法。K. Karteeka Pavan、Allam Appa Rao、AV Dattatreya Rao 和 GR Sridhar。计算机科学杂志 6 (1): 60-66, 2010.pdf

于 2011-10-09T18:39:34.660 回答
1

谷歌的“监督” k 表示聚类和 k++ 表示....还指定您的性能需求(你的 k 是什么?有多少输入点?)

一般来说,几千个点可以很容易地聚集成 naive k 意味着算法实现......所以我会先尝试一下。

此外,如果您不确定 K 应该是多少,请先尝试 MCL 聚类以获得良好的估计。

于 2011-10-09T17:07:23.600 回答