问题标签 [naivebayes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - Perl / Moose 中的朴素贝叶斯计算
这是我编写的一些代码,用于使用朴素贝叶斯分类器计算关于某些观察到的特征的标签概率。这旨在计算朴素贝叶斯公式而不进行平滑处理,并且旨在计算实际概率,因此请使用通常省略的分母。我遇到的问题是,对于示例(如下),“好”标签的概率> 1。(1.30612245)谁能帮我理解那是什么?这是天真的假设的副产品吗?
例子:
印刷:
我不太担心 0 的概率,但更担心好的 > 1 的“概率”。我相信这是经典朴素贝叶斯定义的实现。
这怎么可能> 1?
python - 如何在带有朴素贝叶斯分类器和 NLTK 的 scikit 中使用 k 折交叉验证
我有一个小的语料库,我想使用 10 倍交叉验证来计算朴素贝叶斯分类器的准确率,怎么做。
code-analysis - 在哪里可以找到用于朴素贝叶斯分析的大量计算机语言样本
我正在尝试分析在线代码并想使用贝叶斯分类。但是,我需要大量预分类代码作为示例数据。
也许是二十种左右的顶级语言?
有人知道这样的语料库吗?
python - scikit learn 使用多项式朴素贝叶斯作为三元分类器?
我已经查看并试用了 scikit-learn 关于其多项式朴素贝叶斯分类器的教程。
我想用它来对文本文档进行分类,而关于 NB 的问题在于它将其 P(document|label) 视为其所有独立特征(单词)的乘积。现在,我需要尝试做 3 个三元分类器,其中 P(document|label) = P(wordX|wordX-1,wordX-2,label) * P(wordX-1|wordX-2,wordX-3,标签)。
scikit learn 在哪里支持我可以实现此语言模型并扩展 NB 分类器以基于此执行分类的任何内容?
machine-learning - 朴素贝叶斯模型
当我们使用决策树分类器训练一个训练集时,我们将得到一个树模型。并且这个模型可以转换为规则并且可以合并到java代码中。现在如果我使用朴素贝叶斯训练训练集,模型是什么形式的?以及如何将模型合并到我的 java 代码中?如果训练没有产生模型,那么朴素贝叶斯和惰性学习器(例如 kNN)有什么区别?
提前致谢。
python - Python中的朴素贝叶斯
我正在尝试对我的朴素贝叶斯代码进行拉普拉斯平滑。它在 70% 训练 30% 测试集上给了我 72.5% 的准确率,这有点低。有人看到有什么不对吗?
pos
并且neg
是默认的。
machine-learning - 使用朴素贝叶斯分类
我正在尝试使用朴素贝叶斯对样本进行分类。我的样本量是 280 万条记录,90% 的记录具有类标签(因变量)=“0”,其余记录为“1”。测试集中的分布也是相同的(90% - 10%)朴素贝叶斯分类器将整个测试集标记为“0”。我该如何处理这种情况?在这种情况下是否有任何其他算法可以实现。
weka - 如何在 NaiveBayesMultinomial 中更改分类阈值或在 Weka 中手动计算混淆矩阵
我正在从事垃圾邮件过滤器挖掘项目,我目前正在使用 NaiveBayesMultinomial 分类器通过计算单词出现的频率将垃圾邮件与非垃圾邮件分类。
问题是WEKA默认将分类阈值设置为0.5。但是,将非垃圾邮件误分类为垃圾邮件比反之更有害。
我想调整一下WEKA的NaiveBayesMultinomial算法的阈值,看看混淆矩阵是如何变化的。如果这不是直接可能的,我如何利用 WEKA 的输出来计算不同阈值的混淆矩阵?
以下是对测试拆分进行评估时项目当前结果的摘要:
概括:
按类别的详细精度:
混淆矩阵:
r - 使用 R 进行朴素贝叶斯分类
我一直在与 R 争论使用朴素贝叶斯分类器模型对推文进行分类。
资料:
包含 2 列的训练集:Tweet 和 Class。共有 300 条推文:150 条归类为“应用程序”,150 条归类为“其他”。
客观的:
包含 20 个数据点(推文)的测试集——前 10 个是“App”,后 10 个是“Other”。我想预测一下。我可以在 Excel (blekh) 中成功生成朴素贝叶斯模型,并正确预测 20 个中的 19 个。
我想用 R 复制它。
代码片段
数据样本
调用 head(tweets.all) 会产生:
调用 head(tweets.test) 会产生:
输出
这就是我得到的:
这是垃圾 - 即没有正确分类。知道我做错了什么吗?
naivebayes - RapidMiner 中未生成朴素贝叶斯结果
我在 Fisher 的 Iris 数据集上在 RapidMiner 中运行朴素贝叶斯过程。
我的主要流程如下:
检索虹膜、设置角色、验证
验证子流程如下:
训练集:朴素贝叶斯;测试集:应用模型、性能
当我运行该过程时,没有结果。我在使用 RapidMiner 之前从来没有遇到过这样的问题,当我用谷歌搜索它或搜索 Stackoverflow 时,我找不到任何关于这个问题的信息。