今天,我收到了一个 3 亿条目的 netflow 记录 csv 文件,我的目标是通过任何必要的方式将 netflow 数据转换为合成数据包。经过一番研究,我决定 Scapy 将成为这个过程的一个令人难以置信的工具。我一直在摆弄一些命令,并试图创建准确的数据包来描述 netflow 数据,但我很挣扎,非常感谢以前涉足 Scapy 的人的帮助。
这是我的数据集中的一个示例条目:
1526284499.233,1526284795.166,157.239.11.35,41.75.41.198,443,55915,6,1,24,62,6537,1419,1441,32934,65535,
以下是每个逗号分隔值所代表的内容:
开始时间戳(Epoch 格式):1526284499.233
结束时间戳(Epoch 格式):1526284795.166
源 IP:157.239.11.35
目标 IP:41.75.41.198
IP 标头协议号:443 (HTTPS)
源端口号:55915
目标端口号:6 (TCP)
IP 标头中的 TOS 值:1 (FIN)
TCP 标志:24 (ACK & PSH)
数据包数:62
字节数:6537
路由器入口端口:1419
路由器出口端口:1441
源自治系统:32934 (Facebook)
目标自治系统: 65535
我目前对该条目的 Scapy 表示:
>>> size = bytes(6537)
>>> packet = IP(src="157.240.11.35", dst="41.75.41.200", chksum=24, tos=1, proto=443) / TCP(sport=55915, dport=6, flags=24) / Raw(size)
数据包.show():
###[ IP ]###
version= 4
ihl= None
tos= 0x1
len= None
id= 1
flags=
frag= 0
ttl= 64
proto= 443
chksum= 0x18
src= 157.240.11.35
dst= 41.75.41.200
\options\
###[ TCP ]###
sport= 55915
dport= 6
seq= 0
ack= 0
dataofs= None
reserved= 0
flags= PA
window= 8192
chksum= None
urgptr= 0
options= []
###[ Raw ]###
load= '6537'
我的困惑:
坦率地说,我不确定这是否正确。我感到困惑的是IP协议头是443,表示HTTPS,但目标端口是6,表示TCP。因此,我不确定是否应该包含 TCP,或者是否包含 proto IP 属性是无偿的。此外,我不确定 Raw() 是否是包含每个数据包大小的正确方法,更不用说我是否以适当的方式定义了大小。
请让我知道我哪里出错了,或者我是否真的奇迹般地为这个特定条目创建了一个完美的合成数据包。太感谢了!