非常庞大的KDD-Cup 1999和DARPA 1998/99入侵检测公共数据集是如何生成的?谁知道他们用来分类和保存这些原始数据集会话状态的软件工具?我的意思是一旦你生成了网络数据,你如何将会话分类为anomalous (intrusion)
和normal
?是否有任何特殊的软件工具或机器可以做到这一点?
问问题
1454 次
1 回答
2
停止使用此数据集。
它是模拟的,并不真实。
现代攻击与他们在 90 年代早期模拟的攻击完全不同,您可以使用简单的过滤器检测这些攻击,无需使用机器学习。
该数据集在 ML 社区中名声不佳:
因此,我们强烈建议 (1)所有研究人员停止使用 KDD Cup '99 数据集,(2) KDD Cup 和 UCI 网站在 KDD Cup '99 数据集网页上包含警告,通知研究人员存在已知问题数据集,以及 (3) 会议和期刊的同行评审员 ding 论文(甚至直接拒绝它们,这在网络安全社区中很常见),其结果仅来自 KDD Cup '99 数据集。
无论你用这个合成数据集做什么——它都是无用的。
除此之外,请阅读数据文档。他们似乎使用了 BSM,如果你碰巧在某个地方还有一台 SunOS(现在是 Oracle)计算机......
于 2016-01-24T15:02:49.770 回答