在 C# 中实现垃圾邮件过滤器的任何想法(示例)?我想使用数据库来存储不需要的单词,来训练我的垃圾邮件过滤器。
谢谢。
模式比文字更重要(除了“#FF0000”,您几乎可以 100% 确信以 HTML 邮件形式发送的任何内容都会在其中包含“#FF0000”)。看看http://en.wikipedia.org/wiki/Bayesian_spam_filtering以及它对一种方法的引用(IIRC,第一个技术实验之一发现在训练过滤器后,“#FF0000”是最可能表示垃圾邮件,请参阅我告诉过你的)。
您可能想查看 Paul Graham 垃圾邮件过滤文章您还可以查看C# implementation of spam filter using Naive Bayes Classifier
这是基于单词黑名单的简单手工垃圾邮件过滤器:LINQ Query for Blacklist-Based Spam Filter
当您找不到添加库或复杂的自定义解决方案的动机时,此解决方案适用。