6

我们的网络应用程序收集了大量关于用户操作、网络业务、数据库负载等的数据

所有数据都存储在仓库中,我们对这些数据有很多有趣的看法。

如果发生奇怪的事情,它可能会出现在数据的某个地方。

但是,要手动检测是否发生了异常情况,必须不断查看这些数据并寻找异常情况。

我的问题是:检测动态数据变化的最佳方法是什么,可以被视为“与众不同”。

贝叶斯过滤器(我在阅读垃圾邮件检测时看到过这些)是要走的路吗?

任何指针都会很棒!

编辑:为了澄清数据,例如显示数据库负载的每日曲线。这条曲线通常看起来与昨天的曲线相似。随着时间的推移,这条曲线可能会缓慢变化。

如果曲线每天都在某些范围内发生变化,那将会发出警告,这将是一件好事。

R

4

4 回答 4

5

看看控制图,它们提供了一种可视化跟踪数据变化的方法,并指定数据何时“失控”或“异常”。它们大量用于制造以确保质量控制。

于 2009-08-25T23:27:19.980 回答
4

如果不了解更多有关您拥有的特定数据的信息,就不可能回答这个问题。有关存在哪些方法的概述,请参阅异常检测: Chandola、Banerjee 和 Kumar 的调查。

于 2009-09-04T18:40:19.590 回答
1

这在很大程度上取决于数据是什么。参加统计课程并首先学习基础知识。这通常不是一个容易或简单的问题。

于 2009-08-20T15:18:11.697 回答
1

贝叶斯分类可能会帮助您发现数据中的一些异常情况,具体取决于数据类型以及您训练贝叶斯过滤器的程度。

甚至还有一个可用作网络服务@ uClassify.com

于 2009-08-20T15:36:41.367 回答