classification - 如何在 WEKA 中读取分类器混淆矩阵

Question

抱歉，我是 WEKA 的新手，刚刚学习。

在我的决策树（J48）分类器输出中，有一个混淆矩阵：

a    b   <----- classified as
130  8     a = functional
15   150   b = non-functional

score 22 · Accepted Answer

你读过关于混淆矩阵的维基百科页面吗？在他们的示例中，矩阵周围的文本排列方式略有不同（行标签在左边而不是在右边），但你读起来是一样的。

行表示真实类，列表示分类器输出。然后，每个条目给出<row>被分类为的实例数<column>。在您的示例中，15 个 B 被（错误地）归类为 As，150 个 B 被正确归类为 B，等等。

结果，所有正确的分类都在左上角到右下角的对角线上。对角线之外的所有东西都是某种不正确的分类。

编辑：维基百科页面已经切换了行和列。有时候是这样的。在研究混淆矩阵时，请务必检查标签以查看它是否是行中的真实类、列中的预测类或其他方式。

score 16 · Accepted Answer

我会这样说：

混淆矩阵是 Weka 报告这个 J48 模型在正确和错误方面的表现。

在您的数据中，目标变量是“功能性”或“非功能性”；矩阵的右侧告诉您“a”列是功能性的，而“b”是非功能性的。

这些列告诉您模型如何对样本进行分类 - 这是模型预测的：

另一方面，行代表现实：

了解了列和行，您可以深入了解细节：

所以矩阵的左上角和右下角显示了你的模型正确的东西。

矩阵的左下角和右上角显示了您的模型混淆的地方。

2 回答 2