3

我有一组设备,每个设备都有时间列表 T 表示设备何时打开,例如

设备 A : [周一 16:03, 周一 15:59, 周三 16:05, ... n]

我正在检测使用模式,例如第二天一个人以平均 T+/-5 分钟打开开关,该时间与平均 T 值之间可能存在很强的联系。我们可以说有一种模式,它可以随着时间的推移而建立起来。如果有一天没有值(开关没有打开),即。错过那么信心就会降低。一个问题是需要考虑一天丢失的数据。我们可以说,如果置信度低于阈值,则不存在模式。

我创建了一个简单的工作版本(不考虑失误),但我更感兴趣的是更伟大的头脑会考虑评估和检测是否每天发生事件的最佳方法。我认为这是最好的地方,因为我对一种优雅而美丽的方法很感兴趣。是否存在更好的统计模型来计算出这样的模式?谢谢

4

2 回答 2

4

要尝试的一件相当明显的事情是生成时序数据的功率谱(使用 fft)并寻找显着的峰值。如果您有第 1 天的信号,那么您知道每天都在发生某些事情;如果你也有一个周期为 7 天的信号,那么你就知道有一个每周的组成部分——也许他们在周末没有相同的行为。

这是一种经典的定量方法。你也可以尝试使用更现代的、非结构化的方法——也许训练神经网络以某种方式识别模式?并且没有理由不将这些结合起来 - 功率谱可能会提供参数(周期),用于以更结构化的形式将数据呈现给网络(例如,通过以适当的周期取模)。

最后,我也会做一个文献搜索,看看其他人做了什么。与谷歌一起玩,似乎“时间模式检测”将是一个合适的阶段。

ps 另外,我会将变化的检测与模式的检测分开。首先,我将致力于检测模式。只有当它运作良好时,我才会考虑将其扩展到“每天早 5 分钟”等。部分原因是从简单开始更好,但也因为我不相信这样的更正很重要。大多数人不会每天提前 5 分钟做某事,否则他们最终会在晚上很忙……我们天生就是周期性的,所以我会首先寻找周期,并且只有在有证据表明它们很重要时才考虑线性变化.

pps 统计仅用于评估特定假设的证据。它更多的是关于模式匹配/模式检测,您可能会通过添加这些标签获得更多回复。

于 2012-04-21T19:16:21.210 回答
2

根据您的定义,如果事件e每 24 小时在 10 分钟间隔内发生,并且概率高于给定阈值,则存在模式。这类似于日出问题。在您的情况下,布尔每日事件不是日出,而是事件e在预期间隔内的发生。

事件e明天发生的概率,可以根据继承规则计算出来。根据您的定义,如果此值高于给定阈值 - 存在模式。

于 2012-04-22T19:16:28.383 回答