我有很多 netflow 数据(i.e src_ip, dest_ip, beg_time, end_time, data_size, etc)
,其中一些是定期发生的,我想找出来。
考虑我有n 个netflow(可能在 10^6 左右),其中m个是周期性的。我怎样才能找到哪些是周期性的?
我可以写一个代码,但它至少会是 O(n^3 logn),这在 10^4 个 netflow 之后将永远需要。
我已经搜索过它,但找不到任何东西。
注意:可以考虑数据是按照开始时间排序的,开始时间是32位无符号整数(c++中的uint32)
更正:src_ip
是唯一的,dest_ip
不是唯一的,time for periodicity
是未知的。可能是 5 分钟,也可能是 5 天。您可以忘记src_ip, dest_ip, end_time, data_size
流的其他属性。我只是在寻找开始时间是周期性的事件,你可以考虑,我已经排除了不相关的事件,比如不同的 src_ip,等等......
任何帮助将不胜感激,
谢谢