我们的网络应用程序收集了大量关于用户操作、网络业务、数据库负载等的数据
所有数据都存储在仓库中,我们对这些数据有很多有趣的看法。
如果发生奇怪的事情,它可能会出现在数据的某个地方。
但是,要手动检测是否发生了异常情况,必须不断查看这些数据并寻找异常情况。
我的问题是:检测动态数据变化的最佳方法是什么,可以被视为“与众不同”。
贝叶斯过滤器(我在阅读垃圾邮件检测时看到过这些)是要走的路吗?
任何指针都会很棒!
编辑:为了澄清数据,例如显示数据库负载的每日曲线。这条曲线通常看起来与昨天的曲线相似。随着时间的推移,这条曲线可能会缓慢变化。
如果曲线每天都在某些范围内发生变化,那将会发出警告,这将是一件好事。
R