有人可以请我指出一个强大的 python 实现算法,如 Robust-PCA 或基于角度的异常值检测 (ABOD) 吗?我尝试了几个 Robust-PCA 的 python 实现,但结果证明它们非常占用内存,程序崩溃了。我的数据集是 60,000 X 900 浮点数。R 有 ABOD 的实现,但我想坚持使用 python。
问问题
3043 次
1 回答
1
异常值检测非常重要,有很多研究出版物涉及它。基于密度的算法的可扩展性并不是真正的高性能。我使用 PCA 进行降维,并使用局部异常值因子方法。
您可以在以下位置找到用于海量数据的良好实施版本: https ://github.com/damjankuznar/pylof/blob/master/lof.py
高温高压
于 2017-09-14T12:08:28.343 回答