1

我正试图围绕这项任务展开我的头脑,并想知道是否有标准的方法来执行此操作或一些有用的库。

在几个数据源 S1 ... SN 上跟踪和计时某些事件。记录的信息是事件类型和时间戳。可能有几个相同类型的事件依次发生,也可能是间歇性的。可能存在“遗漏”事件——即当其中一个来源遗漏它时,反之亦然,当来源引入“误报”时。在不同来源对同一事件的观察之间通常存在时间差。由于源的物理位置,该时间差具有恒定分量,但也可能具有由网络延迟和其他因素引入的变化分量。

我需要找到一种算法来找到最佳的最大时间间隔,该时间间隔应该用于将所有来源的观察结果分组到一个“观察到的事件”中,并允许检测丢失的事件和误报。

我想知道解决方案是否真的在统计领域而不是算法中。任何输入将不胜感激。

4

1 回答 1

1

听起来您正在构建一个考勤系统:-) 在我目前正在构建的系统中,这种分组观察也是必要的。就我而言,有些员工持有通行证,他们会将通行证放在通行证阅读器面前以登记他们的出勤情况。首先,系统将选择一名员工的所有考勤。然后它将它们放在一天一盒的盒子里,按注册时间排序。每次注册都将根据它是开始还是停止进行评估。如果第一次注册是开始注册,那么系统最多会在 12 小时后搜索停止注册。如果停止没有出现,则插入停止。当计划已知时,可以实施额外的情报。也许你可以使用统计数据,但就我而言,这是一个算法问题,

于 2010-11-30T18:17:33.723 回答