我已经尝试过用于朴素贝叶斯分类的橙色框架。
- 这些方法非常不直观,文档也非常杂乱无章。这里有人推荐另一个框架吗?
- 我
NaiveBayesian
现在主要使用。
我正在考虑使用 nltk,
NaiveClassification
但他们认为他们不能处理连续变量。
我有哪些选择?
我已经尝试过用于朴素贝叶斯分类的橙色框架。
NaiveBayesian
现在主要使用。我正在考虑使用 nltk,NaiveClassification
但他们认为他们不能处理连续变量。
我有哪些选择?
scikit-learn实现了高斯朴素贝叶斯分类器。一般来说,这个库的目标是在易于阅读和使用的代码与效率之间提供良好的折衷。希望它应该是一个学习算法工作的好图书馆。
这可能是一个很好的起点。它是朴素贝叶斯分类器的 Python 实现的完整源代码(文本解析器、数据存储和分类器)。虽然它已经完成,但它仍然足够小,可以在一个会话中消化。我认为代码写得很好,评论也很好。这是Programming Collective Intelligence一书的源代码文件的一部分。
要获取源代码,请单击链接、dl 并解压缩 zip,从主文件夹“PCI_Code”转到文件夹“第 6 章”,其中包含 Python 源文件“docclass.py”。这是贝叶斯垃圾邮件过滤器的完整源代码。训练数据(电子邮件)保存在一个 sqlite 数据库中,该数据库也包含在同一个文件夹('test.db')中。您需要的唯一外部库是 python 绑定到 sqlite(pysqlite);如果您还没有安装它,您还需要 sqlite 本身)。
我发现Divmod Reverend是最简单易用的 Python 贝叶斯分类器。
我刚刚拿走了 Paul Graham 的 LISP 东西并转换为 Python http://www.paulgraham.com/spam.html
还有SpamBayes,我认为它可以用作一般的朴素贝叶斯分类器,而不仅仅是垃圾邮件。