问题标签 [naivebayes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
302 浏览

machine-learning - Perl / Moose 中的朴素贝叶斯计算

这是我编写的一些代码,用于使用朴素贝叶斯分类器计算关于某些观察到的特征的标签概率。这旨在计算朴素贝叶斯公式而不进行平滑处理,并且旨在计算实际概率,因此请使用通常省略的分母。我遇到的问题是,对于示例(如下),“好”标签的概率> 1。(1.30612245)谁能帮我理解那是什么?这是天真的假设的副产品吗?

例子:

印刷:

我不太担心 0 的概率,但更担心好的 > 1 的“概率”。我相信这是经典朴素贝叶斯定义的实现。

这怎么可能> 1?

0 投票
5 回答
58749 浏览

python - 如何在带有朴素贝叶斯分类器和 NLTK 的 scikit 中使用 k 折交叉验证

我有一个小的语料库,我想使用 10 倍交叉验证来计算朴素贝叶斯分类器的准确率,怎么做。

0 投票
1 回答
63 浏览

code-analysis - 在哪里可以找到用于朴素贝叶斯分析的大量计算机语言样本

我正在尝试分析在线代码并想使用贝叶斯分类。但是,我需要大量预分类代码作为示例数据。

也许是二十种左右的顶级语言?

有人知道这样的语料库吗?

0 投票
1 回答
2560 浏览

python - scikit learn 使用多项式朴素贝叶斯作为三元分类器?

我已经查看并试用了 scikit-learn 关于其多项式朴素贝叶斯分类器的教程。

我想用它来对文本文档进行分类,而关于 NB 的问题在于它将其 P(document|label) 视为其所有独立特征(单词)的乘积。现在,我需要尝试做 3 个三元分类器,其中 P(document|label) = P(wordX|wordX-1,wordX-2,label) * P(wordX-1|wordX-2,wordX-3,标签)。

scikit learn 在哪里支持我可以实现此语言模型并扩展 NB 分类器以基于此执行分类的任何内容?

0 投票
2 回答
303 浏览

machine-learning - 朴素贝叶斯模型

当我们使用决策树分类器训练一个训练集时,我们将得到一个树模型。并且这个模型可以转换为规则并且可以合并到java代码中。现在如果我使用朴素贝叶斯训练训练集,模型是什么形式的?以及如何将模型合并到我的 java 代码中?如果训练没有产生模型,那么朴素贝叶斯和惰性学习器(例如 kNN)有什么区别?

提前致谢。

0 投票
1 回答
372 浏览

python - Python中的朴素贝叶斯

我正在尝试对我的朴素贝叶斯代码进行拉普拉斯平滑。它在 70% 训练 30% 测试集上给了我 72.5% 的准确率,这有点低。有人看到有什么不对吗?

pos并且neg是默认的。

0 投票
3 回答
970 浏览

machine-learning - 使用朴素贝叶斯分类

我正在尝试使用朴素贝叶斯对样本进行分类。我的样本量是 280 万条记录,90% 的记录具有类标签(因变量)=“0”,其余记录为“1”。测试集中的分布也是相同的(90% - 10%)朴素贝叶斯分类器将整个测试集标记为“0”。我该如何处理这种情况?在这种情况下是否有任何其他算法可以实现。

0 投票
3 回答
3791 浏览

weka - 如何在 NaiveBayesMultinomial 中更改分类阈值或在 Weka 中手动计算混淆矩阵

我正在从事垃圾邮件过滤器挖掘项目,我目前正在使用 NaiveBayesMultinomial 分类器通过计算单词出现的频率将垃圾邮件与非垃圾邮件分类。

问题是WEKA默认将分类阈值设置为0.5。但是,将非垃圾邮件误分类为垃圾邮件比反之更有害。

我想调整一下WEKA的NaiveBayesMultinomial算法的阈值,看看混淆矩阵是如何变化的。如果这不是直接可能的,我如何利用 WEKA 的输出来计算不同阈值的混淆矩阵?


以下是对测试拆分进行评估时项目当前结果的摘要:

概括:

按类别的详细精度:

混淆矩阵:

0 投票
0 回答
4899 浏览

r - 使用 R 进行朴素贝叶斯分类

我一直在与 R 争论使用朴素贝叶斯分类器模型对推文进行分类。

资料

包含 2 列的训练集:Tweet 和 Class。共有 300 条推文:150 条归类为“应用程序”,150 条归类为“其他”。

客观的:

包含 20 个数据点(推文)的测试集——前 10 个是“App”,后 10 个是“Other”。我想预测一下。我可以在 Excel (blekh) 中成功生成朴素贝叶斯模型,并正确预测 20 个中的 19 个。

我想用 R 复制它。

代码片段

数据样本

调用 head(tweets.all) 会产生:

调用 head(tweets.test) 会产生:

输出

这就是我得到的:

这是垃圾 - 即没有正确分类。知道我做错了什么吗?

0 投票
0 回答
278 浏览

naivebayes - RapidMiner 中未生成朴素贝叶斯结果

我在 Fisher 的 Iris 数据集上在 RapidMiner 中运行朴素贝叶斯过程。

我的主要流程如下:

检索虹膜、设置角色、验证

验证子流程如下:

训练集:朴素贝叶斯;测试集:应用模型、性能

当我运行该过程时,没有结果。我在使用 RapidMiner 之前从来没有遇到过这样的问题,当我用谷歌搜索它或搜索 Stackoverflow 时,我找不到任何关于这个问题的信息。