我想对一些数据点进行聚类,但每个聚类的最大点数是有限的。所以每个集群都有一个最大大小。有没有任何聚类算法呢?我也可以定义自己的尺寸函数吗?例如,我不想将集群中的点数视为其大小,而是想对集群中所有点的列求和。
问问题
2768 次
3 回答
1
一种快速而非最佳的解决方案是迭代地将数据拆分为 2 个部分,直到数据数量在限制范围内。
于 2014-04-06T22:55:08.167 回答
1
本文解决了具有最小尺寸约束的 k-means 聚类问题:
Bradley、PS、KP Bennett 和 Ayhan Demiriz。“受约束的 k 均值聚类。” 微软研究院,雷德蒙德 (2000):1-8。
然而,本文提出的方法可以很容易地扩展到最大尺寸约束。
这是该算法的一个实现及其解决最小尺寸和最大尺寸约束的扩展。
至于您关于自定义尺寸功能的问题,这将是一个更困难的问题,我认为本地搜索方法更合适。
于 2017-02-10T21:19:18.917 回答
0
由于集群通常会尝试使集群尽可能大,因此这不再是真正的集群。更像是最小生成树,您可以在其中删除最长的边以查找组。
您可以尝试 x-means 之类的方法,即 k-means 变体,您可以在其中拆分您认为太大的集群。
于 2012-07-20T06:37:19.960 回答