问题标签 [naivebayes]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

994 问题

0 投票

2 回答

3030 浏览

classification - 朴素贝叶斯分类器 - 多个决策

我需要知道朴素贝叶斯分类器是否可用于生成多个决策。我找不到任何有证据支持多项决定的例子。我是这个地区的新手。所以，我有点困惑。

其实我需要开发字符识别软件。在那里我需要确定给定的字符是什么。贝叶斯分类器似乎可以用来识别给定的字符是否是特定字符，但它不能给出任何其他建议。

例如，如果给定一个“3”的图像（我们认为它是“3”），如果系统无法将其识别为“3”。如果系统看起来像“2”，系统应该返回“2”。

我对朴素贝叶斯分类器的想法是，一旦我们训练数据，我们就可以询问系统给定字符是否是特定字符。例如。我们绘制一个特定数字的图像并询问系统它是否是“2”。

我进一步注意到 KNN(k 最近邻) 给出了多个决定。给定一个字符，它决定训练数据中给定的最接近的兼容字符。

如果有人可以向我解释朴素贝叶斯分类器是否可用于做出上述多项决策，我们将不胜感激。

2011-08-05T08:03:09.697

0 投票

2 回答

1860 浏览

machine-learning - 使用朴素贝叶斯的文本分类

我正在使用朴素贝叶斯做文本分类机器学习问题。我将每个单词作为一个特征。我已经能够实现它并且我得到了很好的准确性。

我可以使用单词元组作为特征吗？

例如，如果有两个课程，政治和体育。政府这个词可能出现在他们俩身上。然而，在政治中我可以有一个元组（政府、民主），而在体育课上我可以有一个元组（政府、运动员）。所以，如果一个新的文本文章是政治的，元组（政府，民主）的概率比元组（政府，运动员）的概率更大。

我问这是因为这样做我违反了朴素贝叶斯问题的独立性假设，因为我也将单个单词视为特征。

另外，我正在考虑为特征添加权重。例如，3 元组特征的权重将低于 4 元组特征。

从理论上讲，这两种方法是否不会改变朴素贝叶斯分类器的独立性假设？另外，我还没有开始使用我提到的方法，但这会提高准确性吗？我认为准确度可能不会提高，但获得相同准确度所需的训练数据量会更少。

machine-learning naivebayes document-classification

2011-11-30T00:30:34.093

0 投票

1 回答

994 浏览

machine-learning - Apache Mahout 中的加权朴素贝叶斯分类器

我正在使用朴素贝叶斯分类器对客户支持进行情绪分析。但不幸的是，我在客户支持领域没有大量带注释的数据集。但是我在同一个域中有少量注释数据（大约 100 个正数和 100 个负数）。我也有亚马逊产品评论数据集。

无论如何，我是否可以使用 mahout 实现加权的朴素贝叶斯分类器，这样我就可以对一小部分客户支持数据给予更大的权重，对亚马逊产品评论数据给予更小的权重。我猜对上述加权数据集的训练将大大提高准确性。请帮助我。

machine-learning sentiment-analysis mahout naivebayes

2011-12-20T13:33:01.727

0 投票

1 回答

4832 浏览

r - Multinomial Naive Bayes Classifier

I have been looking for a multinomial naive Bayes classifier on CRAN, and so far all I can come up with is the binomial implementation in package e1071. Does anyone know of a package that has a multinomial Bayes classifier?

r bayesian multinomial naivebayes

2012-01-15T22:52:37.723

0 投票

1 回答

1499 浏览