我正在使用 Weka 并应用 J48 来构建我的分类器。我有 40 个功能和 2000 个实例(700 个 a 类和 1300 个 b 类)。
J48 决策树只使用了 40 个特征中的 2 个!无论如何,是否允许 J48 使用所有功能,或者是否有任何其他算法允许使用所有功能?
提前致谢。
我正在使用 Weka 并应用 J48 来构建我的分类器。我有 40 个功能和 2000 个实例(700 个 a 类和 1300 个 b 类)。
J48 决策树只使用了 40 个特征中的 2 个!无论如何,是否允许 J48 使用所有功能,或者是否有任何其他算法允许使用所有功能?
提前致谢。
也许是因为J48不需要更多的属性。
您可以在选项卡中检查特征的相关性,并使用搜索方法和评估Select attribute
器运行选择器。它将向您展示每个特征和每个类之间的关系,它还会告诉您哪些特征最能描述您的类。Ranker
Principal Components
分类不需要所有 40 个特征。因为某些特征可能是冗余的(例如相关的)或不包含区分信息。
您可以在之前从Weka ExplorerSelect attributes
的选项卡中运行功能选择,然后查看哪些功能很重要。
您还可以测试分类器,例如SVM
(libSVM 或 SMO)、Neural Network
(MultilayerPerceptron)和/或Random Forest
因为它们通常会给出最好的分类结果(取决于问题)