我发现自己需要处理使用tcpdump
. 阅读流量并不难,但有点棘手的是发现流量中存在“峰值”的地方。我最关心的是 TCP SYN 数据包,我想做的是找到给定目标端口的流量突然增加的日子。有相当多的数据需要处理(大约一年)。
到目前为止,我尝试的是使用指数移动平均线,这足以让我得到一些有趣的度量,但是将我所看到的与外部数据源进行比较似乎在将事物标记为时有点过于激进异常的。
我考虑过使用指数移动平均线加上历史数据的组合(可能从过去 7 天开始,认为我所看到的应该有一个每周周期),因为我读过的一些论文似乎有成功地以这种方式对资源使用进行建模。
那么,有没有人知道一种好的方法或某个地方可以去阅读这类事情。
我一直使用的移动平均线大致如下:
avg = avg+0.96*(new-avg)
avg
成为 EMA 并成为new
新的衡量标准。我一直在尝试使用什么阈值,但发现“在权衡新值之前必须是高于平均值的给定因素”和“必须至少高 3”的组合以给出最不坏的结果。