我正在我的数据集上尝试不同的 Weka 分类器。我有小数据集,我将我的数据分为五类。我的问题是,当我通过不同的分类器应用交叉验证或百分比拆分分类时,我会得到非常不同的结果。
例如,当我使用NaiveBayse
orBayseNet
分类器时,所有类的 F 分数都在 40 左右,但使用SMO
我得到的 F 分数为 20。当我使用LibLinear
分类器时,得到的结果更差,它的 F 分数为15左右。
也许我应该提到,由于LibLinear
分类器不接受名义,我为每个可能的名义值分配了一个代码,并将它们用作Numeric
我的数据集中的值。
谁能告诉我为什么我会得到如此不同的结果?我希望所有分类器都有大致相似的结果。
此外,当我LibLinear
在我的测试集上使用时,我将所有数据归为一类,而其他四类中没有实例。
提前致谢,