machine-learning - 分类 - KDD-Cup 1999 和 DARPA 1998/99 公共入侵检测数据集

Question

非常庞大的KDD-Cup 1999和DARPA 1998/99入侵检测公共数据集是如何生成的？谁知道他们用来分类和保存这些原始数据集会话状态的软件工具？我的意思是一旦你生成了网络数据，你如何将会话分类为anomalous (intrusion)和normal？是否有任何特殊的软件工具或机器可以做到这一点？

score 2 · Accepted Answer

停止使用此数据集。

它是模拟的，并不真实。

现代攻击与他们在 90 年代早期模拟的攻击完全不同，您可以使用简单的过滤器检测这些攻击，无需使用机器学习。

该数据集在 ML 社区中名声不佳：

因此，我们强烈建议 (1)所有研究人员停止使用 KDD Cup '99 数据集，(2) KDD Cup 和 UCI 网站在 KDD Cup '99 数据集网页上包含警告，通知研究人员存在已知问题数据集，以及 (3) 会议和期刊的同行评审员 ding 论文（甚至直接拒绝它们，这在网络安全社区中很常见），其结果仅来自 KDD Cup '99 数据集。

无论你用这个合成数据集做什么——它都是无用的。

除此之外，请阅读数据文档。他们似乎使用了 BSM，如果你碰巧在某个地方还有一台 SunOS（现在是 Oracle）计算机......

machine-learning - 分类 - KDD-Cup 1999 和 DARPA 1998/99 公共入侵检测数据集

1 回答 1

停止使用此数据集。

Related

Reference