29

我想知道是否有针对垃圾邮件和文本分类的贝叶斯过滤的良好且干净的面向对象编程 (OOP) 实现?这仅用于学习目的。

4

6 回答 6

12

我绝对推荐Weka,它是一个用 Java 编写的开源数据挖掘软件:

Weka 是用于数据挖掘任务的机器学习算法的集合。这些算法既可以直接应用于数据集,也可以从您自己的 Java 代码中调用。Weka 包含用于数据预处理、分类、回归、聚类、关联规则和可视化的工具。它也非常适合开发新的机器学习方案。

如上所述,它附带了许多不同的分类器,例如SVMWinnowC4.5、朴素贝叶斯(当然)等等(参见API 文档)。请注意,众所周知,在垃圾邮件检测或文本分类领域,许多分类器的性能都比朴素贝叶斯好得多。

此外,Weka 为您带来了非常强大的 GUI ……</p>

于 2008-09-03T19:46:47.923 回答
5

也许https://ci-bayes.dev.java.net/http://www.cs.cmu.edu/~javabayes/Home/node2.html

我也从来没有玩过它。

于 2008-08-04T08:54:16.393 回答
5

查看编程集体智能的第 6 章

于 2008-09-01T06:19:15.760 回答
3

这是 C# 中贝叶斯过滤的实现:A Naive Bayesian Spam Filter for C#(托管在 CodeProject 上)。

于 2008-08-04T09:08:32.217 回答
2

nBayes - CodePlex 上托管的另一个 C# 实现

于 2009-05-08T14:59:46.683 回答
1

用法语,但你应该可以找到下载链接 :) PHP Naive Bayesian Filter

于 2008-08-04T11:03:51.437 回答