问题标签 [naivebayes]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

994 问题

0 投票

1 回答

302 浏览

machine-learning - Perl / Moose 中的朴素贝叶斯计算

这是我编写的一些代码，用于使用朴素贝叶斯分类器计算关于某些观察到的特征的标签概率。这旨在计算朴素贝叶斯公式而不进行平滑处理，并且旨在计算实际概率，因此请使用通常省略的分母。我遇到的问题是，对于示例（如下），“好”标签的概率> 1。（1.30612245）谁能帮我理解那是什么？这是天真的假设的副产品吗？

例子：

印刷：

我不太担心 0 的概率，但更担心好的 > 1 的“概率”。我相信这是经典朴素贝叶斯定义的实现。

这怎么可能> 1？

2012-12-18T19:52:56.547

0 投票

5 回答

58749 浏览

python - 如何在带有朴素贝叶斯分类器和 NLTK 的 scikit 中使用 k 折交叉验证

我有一个小的语料库，我想使用 10 倍交叉验证来计算朴素贝叶斯分类器的准确率，怎么做。

python scikit-learn nltk cross-validation naivebayes

2013-05-04T21:50:36.670

0 投票

1 回答

63 浏览

code-analysis - 在哪里可以找到用于朴素贝叶斯分析的大量计算机语言样本

我正在尝试分析在线代码并想使用贝叶斯分类。但是，我需要大量预分类代码作为示例数据。

也许是二十种左右的顶级语言？

有人知道这样的语料库吗？

code-analysis naivebayes

2013-06-01T11:16:43.510

0 投票

1 回答

2560 浏览

python - scikit learn 使用多项式朴素贝叶斯作为三元分类器？

我已经查看并试用了 scikit-learn 关于其多项式朴素贝叶斯分类器的教程。

我想用它来对文本文档进行分类，而关于 NB 的问题在于它将其 P(document|label) 视为其所有独立特征（单词）的乘积。现在，我需要尝试做 3 个三元分类器，其中 P(document|label) = P(wordX|wordX-1,wordX-2,label) * P(wordX-1|wordX-2,wordX-3,标签）。

scikit learn 在哪里支持我可以实现此语言模型并扩展 NB 分类器以基于此执行分类的任何内容？

python scipy scikit-learn naivebayes

2013-06-27T02:49:29.117

0 投票

2 回答

303 浏览

machine-learning - 朴素贝叶斯模型

当我们使用决策树分类器训练一个训练集时，我们将得到一个树模型。并且这个模型可以转换为规则并且可以合并到java代码中。现在如果我使用朴素贝叶斯训练训练集，模型是什么形式的？以及如何将模型合并到我的 java 代码中？如果训练没有产生模型，那么朴素贝叶斯和惰性学习器（例如 kNN）有什么区别？

提前致谢。

machine-learning artificial-intelligence classification naivebayes

2013-09-05T10:28:09.343

0 投票

1 回答

372 浏览

python - Python中的朴素贝叶斯

我正在尝试对我的朴素贝叶斯代码进行拉普拉斯平滑。它在 70% 训练 30% 测试集上给了我 72.5% 的准确率，这有点低。有人看到有什么不对吗？

pos并且neg是默认的。

python nlp bayesian naivebayes smoothing

2013-11-12T16:15:09.747

0 投票

3 回答

970 浏览

machine-learning - 使用朴素贝叶斯分类

我正在尝试使用朴素贝叶斯对样本进行分类。我的样本量是 280 万条记录，90% 的记录具有类标签（因变量）=“0”，其余记录为“1”。测试集中的分布也是相同的（90% - 10%）朴素贝叶斯分类器将整个测试集标记为“0”。我该如何处理这种情况？在这种情况下是否有任何其他算法可以实现。

machine-learning classification probability naivebayes

2013-11-19T10:31:29.073

0 投票

3 回答

3791 浏览

weka - 如何在 NaiveBayesMultinomial 中更改分类阈值或在 Weka 中手动计算混淆矩阵

我正在从事垃圾邮件过滤器挖掘项目，我目前正在使用 NaiveBayesMultinomial 分类器通过计算单词出现的频率将垃圾邮件与非垃圾邮件分类。

问题是WEKA默认将分类阈值设置为0.5。但是，将非垃圾邮件误分类为垃圾邮件比反之更有害。

我想调整一下WEKA的NaiveBayesMultinomial算法的阈值，看看混淆矩阵是如何变化的。如果这不是直接可能的，我如何利用 WEKA 的输出来计算不同阈值的混淆矩阵？

以下是对测试拆分进行评估时项目当前结果的摘要：

概括：

按类别的详细精度：

混淆矩阵：

weka naivebayes confusion-matrix

2014-04-09T16:08:54.413

0 投票

0 回答

4899 浏览

r - 使用 R 进行朴素贝叶斯分类

我一直在与 R 争论使用朴素贝叶斯分类器模型对推文进行分类。

资料：

包含 2 列的训练集：Tweet 和 Class。共有 300 条推文：150 条归类为“应用程序”，150 条归类为“其他”。

客观的：

包含 20 个数据点（推文）的测试集——前 10 个是“App”，后 10 个是“Other”。我想预测一下。我可以在 Excel (blekh) 中成功生成朴素贝叶斯模型，并正确预测 20 个中的 19 个。

我想用 R 复制它。

代码片段

数据样本

调用 head(tweets.all) 会产生：

调用 head(tweets.test) 会产生：

输出

这就是我得到的：

这是垃圾 - 即没有正确分类。知道我做错了什么吗？

r twitter classification bayesian naivebayes

2014-05-03T15:49:19.197

0 投票

0 回答

278 浏览

naivebayes - RapidMiner 中未生成朴素贝叶斯结果

我在 Fisher 的 Iris 数据集上在 RapidMiner 中运行朴素贝叶斯过程。

我的主要流程如下：

检索虹膜、设置角色、验证

验证子流程如下：

训练集：朴素贝叶斯；测试集：应用模型、性能

当我运行该过程时，没有结果。我在使用 RapidMiner 之前从来没有遇到过这样的问题，当我用谷歌搜索它或搜索 Stackoverflow 时，我找不到任何关于这个问题的信息。

naivebayes rapidminer

2014-05-15T03:59:00.853

1 2 3 4 5 6 7 8 9 10

问题标签 [naivebayes]

Reference