我们应该在EM聚类中选择delta的值是多少?
它为不同的 delta 值给出了不同的度量值。
EM 中的 delta 参数是检测收敛所必需的。由于 EM 在内部使用软分配,它会继续将值更新为任意数字(从技术上讲,它最终会耗尽精度并停止)。只要你选择一个足够小的值,你应该没问题。
但是,EM 是随机初始化的。您有不同的初始化选项,但最好从随机初始化开始。多次运行 EM 并仅保留最佳结果是减少仅找到局部最优值的机会的可行方法。
因此,你得到不同的结果一点也不奇怪。事实上,同样的delta,你应该会看到不同的结果……
另请参阅:维基百科 EM 聚类