问题标签 [information-gain]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
75 浏览

python - Python:如何实现对朴素贝叶斯分类器的互信息特征选择

我正在尝试使用朴素贝叶斯分类器比较两个特征选择、TF-IDF 和信息增益(互信息)之间的准确性。

对于 Tf-idf 我这样做了:

这就是我使用train_test_split和使用数据框MultinomialNB对其进行分类之前的样子

但我不知道如何为互信息做这件事,因为我从互信息中得到的输出与 tf-idf 不同(上面的例子)。它返回一维数组

那么如何在朴素贝叶斯分类中使用互信息特征选择呢?

到目前为止我所做的是使用 count_vector 来获取特征计数

拆分它

并找到mutual_info_classif

我不知道下一步将其应用于朴素贝叶斯分类器。

0 投票
1 回答
31 浏览

machine-learning - Weka 中决策树的信息增益

我在 Weka 中使用GainRatioAttributeEval。我得到了这个结果

在此处输入图像描述

我无法解释这个结果。我的意思是这部分是什么意思?

我的数据集有 6 个属性和 200 个实例。其中药物是我的类属性。我还附上了数据集的预处理概述。

在此处输入图像描述

我知道如何计算信息增益并创建决策树。但我无法得到这个结果。