让我说,首先,我是 WEKA 新手。
我将 WEKA 用于二进制分类问题,其中某些指标被用于获得实例的是/否答案。
为了举例说明这个问题,这是我使用 BayesNet 得到的一组包含 288 个实例、190 个“是”和 98 个“否”值的混淆矩阵:
a b <-- classified as
190 0 | a = yes
98 0 | b = no
这种绝对分离也适用于其他一些分类器,但并非所有分类器都是如此。也就是说,即使分类器的值没有极化到这样的程度,它们确实对主要类别有明确的偏见。例如,下面是 RandomForest 的结果:
a b <-- classified as
164 34 | a = yes
62 28 | b = no
我很确定我错过了一些非常明显的东西。