1

嗨,我有一个关于我正在尝试开发的系统的概念性问题,该系统试图对电子邮件进行分类。我有一大组 (>100k) 不是垃圾邮件的邮件和一大组未分类的邮件。那么是否可以在没有垃圾邮件数据集的情况下使用一种方法(也许是贝叶斯)来检测垃圾邮件?我绝对需要对垃圾邮件进行分类吗?

4

1 回答 1

1

是的,你可以这么做。结果很可能比监督方法更差。一般问题通常称为异常检测。这个想法是为您的数据创建一个模型,并为每个新实例确定它是否来自该模型。有很多方法可以做到这一点,选择正确的方法很困难。你可以从这里开始学习。

于 2013-05-29T08:20:06.250 回答