我正试图围绕这项任务展开我的头脑,并想知道是否有标准的方法来执行此操作或一些有用的库。
在几个数据源 S1 ... SN 上跟踪和计时某些事件。记录的信息是事件类型和时间戳。可能有几个相同类型的事件依次发生,也可能是间歇性的。可能存在“遗漏”事件——即当其中一个来源遗漏它时,反之亦然,当来源引入“误报”时。在不同来源对同一事件的观察之间通常存在时间差。由于源的物理位置,该时间差具有恒定分量,但也可能具有由网络延迟和其他因素引入的变化分量。
我需要找到一种算法来找到最佳的最大时间间隔,该时间间隔应该用于将所有来源的观察结果分组到一个“观察到的事件”中,并允许检测丢失的事件和误报。
我想知道解决方案是否真的在统计领域而不是算法中。任何输入将不胜感激。