问题标签 [information-gain]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python:如何实现对朴素贝叶斯分类器的互信息特征选择
我正在尝试使用朴素贝叶斯分类器比较两个特征选择、TF-IDF 和信息增益(互信息)之间的准确性。
对于 Tf-idf 我这样做了:
这就是我使用train_test_split
和使用数据框MultinomialNB
对其进行分类之前的样子
但我不知道如何为互信息做这件事,因为我从互信息中得到的输出与 tf-idf 不同(上面的例子)。它返回一维数组
那么如何在朴素贝叶斯分类中使用互信息特征选择呢?
到目前为止我所做的是使用 count_vector 来获取特征计数
拆分它
并找到mutual_info_classif
我不知道下一步将其应用于朴素贝叶斯分类器。