我找不到使用 R 进行 k-centers 聚类的简单库函数,而我可以找到 k-means ( kmeans()
) 和层次聚类 ( hclust()
)。
如本文所述,是否有使用 R 进行简单贪婪 k 中心聚类的库函数
如果不是 - 因为我是 R 新手 - 将如何实现它(我理解逻辑 - 只是不知道如何用 R 代码实际编写它)。
我找不到使用 R 进行 k-centers 聚类的简单库函数,而我可以找到 k-means ( kmeans()
) 和层次聚类 ( hclust()
)。
如本文所述,是否有使用 R 进行简单贪婪 k 中心聚类的库函数
如果不是 - 因为我是 R 新手 - 将如何实现它(我理解逻辑 - 只是不知道如何用 R 代码实际编写它)。
尝试kmeans
使用method = "centers"
.
如果这不是您想要的,那么 CRAN 在http://cran.r-project.org/web/views/Cluster.html有一个包含数十个包的集群任务视图。
从这篇博文中的描述来看,这似乎类似于用于 k-means 的众多种子策略之一。我还没有真正称它为聚类方法,而是预聚类或类似的东西。
也许你应该看看flexclust
R 的包,我相信它有一些 k-means 变体和初始化,也许它有这个变体作为一个初始化选项。或者它可能在http://cran.r-project.org/web/views/Cluster.html
请注意,总是选择最远的对象很容易选择异常值作为聚类中心!看一下基于类似想法的例如 k-means++,但更聪明(另外,它更好地支持随机化,因此您可以尝试多种不同的初始化)。或者您可以选择最接近(2k-1)/(2k)
分位数的对象,这可能是一个好的聚类中心的更好猜测。