3

有人可以请我指出一个强大的 python 实现算法,如 Robust-PCA 或基于角度的异常值检测 (ABOD) 吗?我尝试了几个 Robust-PCA 的 python 实现,但结果证明它们非常占用内存,程序崩溃了。我的数据集是 60,000 X 900 浮点数。R 有 ABOD 的实现,但我想坚持使用 python。

4

1 回答 1

1

异常值检测非常重要,有很多研究出版物涉及它。基于密度的算法的可扩展性并不是真正的高性能。我使用 PCA 进行降维,并使用局部异常值因子方法。

您可以在以下位置找到用于海量数据的良好实施版本: https ://github.com/damjankuznar/pylof/blob/master/lof.py

高温高压

于 2017-09-14T12:08:28.343 回答