0

我正在我的数据集上尝试不同的 Weka 分类器。我有小数据集,我将我的数据分为五类。我的问题是,当我通过不同的分类器应用交叉验证或百分比拆分分类时,我会得到非常不同的结果。

例如,当我使用NaiveBayseorBayseNet分类器时,所有类的 F 分数都在 40 左右,但使用SMO我得到的 F 分数为 20。当我使用LibLinear分类器时,得到的结果更差,它的 F 分数为15左右。

也许我应该提到,由于LibLinear分类器不接受名义,我为每个可能的名义值分配了一个代码,并将它们用作Numeric我的数据集中的值。

谁能告诉我为什么我会得到如此不同的结果?我希望所有分类器都有大致相似的结果。

此外,当我LibLinear在我的测试集上使用时,我将所有数据归为一类,而其他四类中没有实例。

提前致谢,

4

1 回答 1

0

为什么你会期待类似的结果?特别是对于小数据集,我认为不同的方法很容易导致不同的预测。线性模型也具有容差阈值,这将导致收敛前提前终止。例如,您可以在 LibLINEAR 或 SMO 中使用它。

于 2014-03-18T18:20:06.093 回答