0

最近我选择在公共数据集上使用 DBSCAN 聚类。但是参数 Eps 和 minpts 非常敏感,以至于很难在整个数据集上获得具有良好性能的良好参数值。在调整 DBSCAN 的参数时似乎存在过拟合。我知道EM算法可以用来调整GMM模型的参数。我想知道是否可以在DBSCAN中使用EM算法。我需要一些关于它的想法或建议。以前有人试过吗?

4

1 回答 1

1

具有高斯混合模型的 EM 算法运行良好,因为 GMM 是一种概率模型。它为每个点产生一个概率,并且您知道如何推断模型参数以最大化概率。

我认为您不能有意义地将其应用于标记 DBSCAN。这种连通性模型中没有“概率”。连接是一个二元属性,如果你试图最大化它,它只会让所有东西都连接起来,即 epsilon = inifnity。

于 2017-11-18T12:17:12.043 回答