我在具有 138,314 行和 43 个属性的数据集上使用maxent 分类器。训练数据的形式如下:
Feature Class
Cloudy Sad... Humid Outdoor
如果我在保留数据上测试模型,准确率刚好在 70% 以上,我想通过特征选择来提高准确率。我的问题是,如何使用 Maxent 分类器进行特征选择?有没有其他方法可以提高 Maxent 模型的准确性?
或者像Ratnaparkhi 一篇论文所说:
我们使用了一个非常简单的特征选择策略:假设任何出现少于 5 次的特征都是有噪声的并丢弃它。(Ratnaparkhi, A. (1998))
任何帮助将不胜感激。