-1

我是机器学习的初学者。到目前为止,我看到的算法几乎可以衡量一个记录(众多字段)与数据集中其他记录(例如 k-means)的差异。

我正在尝试将一些 ml 算法应用于网络入侵检测,但我认为此类算法可能不合适,因为它们将记录视为单个实体,而不是记录上下文中的记录(即跟随或跟随特定记录)。例如,对应于同步数据包的记录在正常流量的记录中存在时可能是正常的,但如果该记录存​​在于许多其他同步记录中,那么我们可能正在处理同步泛洪攻击。这只是一个例子……我希望我说清楚。

有没有具有这种能力的算法?如果是这样,任何人都可以指点?

先感谢您!

4

2 回答 2

1

您需要检查有状态的方法,例如隐马尔可夫模型或卡尔曼滤波器,它们确实考虑了 contrxt。

或者,您可以创建先前值的长向量并使用它来推断上下文,但 HMM 是普遍采用的方法,并且具有许多理论和实践优势。

于 2013-02-10T14:15:04.590 回答
0

你在正确的区域。我认为您对分类算法感兴趣,而不是聚类。

对您拥有的数据进行聚类可以让您了解哪些特征是重要的。但它的分类允许你决定一个请求是否是敌对的。它与垃圾邮件过滤有更多共同点。

于 2013-02-10T14:15:13.777 回答