我尝试使用 J48 算法在 Weka 中的iris.arff数据集上运行一个简单的分类。我使用了 10 折的交叉验证,并且 - 如果我没记错的话 - J48 的所有默认设置。结果是 96% 的准确率与 6 个错误分类的实例。
这是我的问题:据此,树可视化中的第二个数字是每个叶子中错误分类的实例的数量,但是为什么它们的总和不是 6 而是 3?
编辑:使用不同的测试选项运行算法我在准确性(以及因此错误的数量)方面获得了不同的结果,但是当我可视化树时,我总是得到具有相同 3 个错误的同一棵树。我仍然无法解释为什么。