-1

根据 Andrew Ng 的 coursera 讲座,异常检测算法之一是使用多元高斯构造概率密度。

如果数据显示集群结构(不是单个块)怎么办?在这种情况下,我们是否会求助于无监督聚类来构建密度?如果是,该怎么做?有没有其他系统的方法来发现这种情况是否存在?

4

1 回答 1

1

您可以只使用常规 GMM 并使用可能性阈值来识别异常值。不能很好地拟合模型的点是异常值。

只要您的数据确实由高斯组成,这就可以了。

此外,集群相当昂贵。通常直接使用非参数异常值模型(如 KNN 或 LOF 或 LOOP)会更快。

于 2018-06-12T06:02:44.453 回答