问题标签 [naivebayes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
classification - 朴素贝叶斯分类器 - 多个决策
我需要知道朴素贝叶斯分类器是否可用于生成多个决策。我找不到任何有证据支持多项决定的例子。我是这个地区的新手。所以,我有点困惑。
其实我需要开发字符识别软件。在那里我需要确定给定的字符是什么。贝叶斯分类器似乎可以用来识别给定的字符是否是特定字符,但它不能给出任何其他建议。
例如,如果给定一个“3”的图像(我们认为它是“3”),如果系统无法将其识别为“3”。如果系统看起来像“2”,系统应该返回“2”。
我对朴素贝叶斯分类器的想法是,一旦我们训练数据,我们就可以询问系统给定字符是否是特定字符。例如。我们绘制一个特定数字的图像并询问系统它是否是“2”。
我进一步注意到 KNN(k 最近邻) 给出了多个决定。给定一个字符,它决定训练数据中给定的最接近的兼容字符。
如果有人可以向我解释朴素贝叶斯分类器是否可用于做出上述多项决策,我们将不胜感激。
machine-learning - 使用朴素贝叶斯的文本分类
我正在使用朴素贝叶斯做文本分类机器学习问题。我将每个单词作为一个特征。我已经能够实现它并且我得到了很好的准确性。
我可以使用单词元组作为特征吗?
例如,如果有两个课程,政治和体育。政府这个词可能出现在他们俩身上。然而,在政治中我可以有一个元组(政府、民主),而在体育课上我可以有一个元组(政府、运动员)。所以,如果一个新的文本文章是政治的,元组(政府,民主)的概率比元组(政府,运动员)的概率更大。
我问这是因为这样做我违反了朴素贝叶斯问题的独立性假设,因为我也将单个单词视为特征。
另外,我正在考虑为特征添加权重。例如,3 元组特征的权重将低于 4 元组特征。
从理论上讲,这两种方法是否不会改变朴素贝叶斯分类器的独立性假设?另外,我还没有开始使用我提到的方法,但这会提高准确性吗?我认为准确度可能不会提高,但获得相同准确度所需的训练数据量会更少。
machine-learning - Apache Mahout 中的加权朴素贝叶斯分类器
我正在使用朴素贝叶斯分类器对客户支持进行情绪分析。但不幸的是,我在客户支持领域没有大量带注释的数据集。但是我在同一个域中有少量注释数据(大约 100 个正数和 100 个负数)。我也有亚马逊产品评论数据集。
无论如何,我是否可以使用 mahout 实现加权的朴素贝叶斯分类器,这样我就可以对一小部分客户支持数据给予更大的权重,对亚马逊产品评论数据给予更小的权重。我猜对上述加权数据集的训练将大大提高准确性。请帮助我。
r - Multinomial Naive Bayes Classifier
I have been looking for a multinomial naive Bayes classifier on CRAN, and so far all I can come up with is the binomial implementation in package e1071
. Does anyone know of a package that has a multinomial Bayes classifier?
matlab - Matlab 朴素贝叶斯
您好,我正在使用 KDD 1999 数据集,我正在寻找在 matlab 中应用朴素贝叶斯的方法。我想知道的是 kdd 数据集是一个 494021x42 的数据数组,如果您在下面的朴素贝叶斯代码中注意到“training”和“target_class”:
我想知道的是与 kdd 数据集攻击类型相关的“Target_class”?
还是目标类是“测试”集中包含的列标题?IE
weka - 属性选择+weka+朴素贝叶斯
我想知道以下三种方法中哪种方法最适合执行属性选择:
- 使用元分类器
- 过滤法
- 本机方法,直接使用属性选择类
我使用的分类器是朴素贝叶斯。
谁能指导我找到最佳选择?
python - 在 NLTK 中保存朴素贝叶斯训练分类器
对于如何保存训练有素的分类器,我有点困惑。例如,每次我想使用它时重新训练一个分类器显然真的很糟糕而且很慢,我如何保存它并在需要时再次加载它?代码如下,提前感谢您的帮助。我正在使用带有 NLTK 朴素贝叶斯分类器的 Python。
algorithm - 朴素贝叶斯分类的简单解释
我发现很难理解朴素贝叶斯的过程,我想知道是否有人可以用英语简单的逐步过程来解释它。我知道它需要按发生的时间进行比较作为概率,但我不知道训练数据与实际数据集的关系如何。
请解释一下训练集的作用。我在这里给出一个非常简单的水果示例,例如香蕉
python - 在 NLTK 中实现词袋朴素贝叶斯分类器
我基本上和这个人有同样的问题.. Naive Bayes 分类器的 NLTK 书中的示例只考虑一个单词是否出现在文档中作为一个特征.. 它没有考虑单词的频率作为特征看看(“词袋”)。
答案之一似乎表明使用内置的 NLTK 分类器无法做到这一点。是这样吗?如何使用 NLTK 进行频率/词袋 NB 分类?
algorithm - 朴素贝叶斯分类器中的“朴素”是什么?
什么是朴素的朴素贝叶斯?