在 K-means 算法的 MATLAB 版本中,有一个非常有用的标志,表示如果集群在优化过程中丢失所有成员观测值时要采取的行动。MATLAB 中有 3 种可能性:
将空簇视为错误
删除任何变为空的集群
创建一个由离其质心最远的一点组成的新集群
有谁知道在这种情况下 DAAL K-means 会发生什么?我在文档中找不到任何关于此的内容。
在英特尔 DAAL 的 K-Means 实施中,在程序执行期间自动收集有关特征向量的聚类信息。选择离它们分配的质心最远的特征作为新的聚类中心,以补偿迭代期间的空聚类。
值得注意的是,良好的集群初始化选择可以避免空集群。
有关详细信息,请参阅https://software.intel.com/en-us/daal-programming-guide-details-5。