所有规则中错误分类(见树)的总和为 2097(来自 895+700+428+74)。但是混淆矩阵是 2121(来自 1999+122)。有人可以解释这种差异吗?数字怎么不一样?
问问题
483 次
1 回答
1
分类器模型描述的 Weka 输出包含两个部分
- 训练数据错误
- 分层交叉验证
第一个只是评估训练数据本身的训练分类器,而第二个是交叉验证,它在每个折叠中平均分配每个类的实例。因此,与简单的交叉验证相比,分层交叉验证应该能更好地描述分类器的性能。
我认为您在这里发布了分层交叉验证的混淆矩阵,因此树中显示的未分类实例的数量(它们必须来自对训练数据的评估)是不同的。
决策树输出在链接https://weka.wikispaces.com/Primer#classifiers中有很好的描述。树中显示的错误分类示例与分层交叉验证部分下的混淆矩阵中可以看到的示例不同。
希望,我是对的。
于 2016-08-30T12:06:23.283 回答