4

我计划使用朴素贝叶斯分类模型来实现垃圾邮件过滤器。

在网上我看到很多关于朴素贝叶斯分类的信息,但问题是它有很多数学内容,而不是清楚地说明它是如何完成的。问题是我更像是一个程序员而不是数学家(是的,我在学校学过概率和贝​​叶斯定理,但很长一段时间都没有接触过,而且我现在没有学习它的奢侈(几乎3 周的时间来制作一个工作原型))。

因此,如果有人可以解释或指出我为程序员而不是数学家解释的位置,那将是一个很大的帮助。

PS:顺便说一句,如果你想知道的话,我必须用 C 来实现它。:(

问候,微内核

4

5 回答 5

5

Programming Collective Intelligence一书的章节涵盖了这种方法和其他方法。本章(#6)无需参考前面的章节即可理解,写得很清楚,并且只讨论了完成工作所必需的最小数学。

于 2010-04-11T18:34:04.810 回答
2

我强烈推荐Andrew Moore 的教程,我认为你应该从这个开始。

于 2010-04-23T15:10:14.963 回答
2

你可以试试这个网站。它有一些源代码。

于 2010-04-11T17:52:18.757 回答
1

你看过dspam吗?

http://dspam.irontec.com/faq.shtml#1.0

http://www.nuclearelephant.com/

于 2010-07-23T19:51:58.203 回答
1

您还可以查看POPFile,一个开源垃圾邮件过滤引擎。

于 2010-04-11T19:42:02.187 回答