17

抱歉,我是 WEKA 的新手,刚刚学习。

在我的决策树(J48)分类器输出中,有一个混淆矩阵:

a    b   <----- classified as
130  8     a = functional
15   150   b = non-functional
  • 我如何阅读这个矩阵?a和b有什么区别?
  • 另外,谁能向我解释什么是域值?
4

2 回答 2

22

你读过关于混淆矩阵的维基百科页面吗?在他们的示例中,矩阵周围的文本排列方式略有不同(行标签在左边而不是在右边),但你读起来是一样的。

行表示真实类,列表示分类器输出。然后,每个条目给出<row>被分类为的实例数<column>。在您的示例中,15 个 B 被(错误地)归类为 As,150 个 B 被正确归类为 B,等等。

结果,所有正确的分类都在左上角到右下角的对角线上。对角线之外的所有东西都是某种不正确的分类。

编辑:维基百科页面已经切换了行和列。有时候是这样的。在研究混淆矩阵时,请务必检查标签以查看它是否是行中的真实类、列中的预测类或其他方式。

于 2013-03-05T01:28:12.643 回答
16

我会这样说:

混淆矩阵是 Weka 报告这个 J48 模型在正确和错误方面的表现。

在您的数据中,目标变量是“功能性”或“非功能性”;矩阵的右侧告诉您“a”列是功能性的,而“b”是非功能性的。

这些列告诉您模型如何对样本进行分类 - 这是模型预测的:

  • 第一列包含您的模型认为是“a”的所有样本——总共 145 个
  • 第二列包含您的模型认为是“b”的所有样本 - 其中 158 个

另一方面,行代表现实:

  • 第一行包含所有真正为“a”的样本——总共 138 个
  • 第二行包含所有真正为“b”的样本 - 其中 165 个

了解了列和行,您可以深入了解细节:

  • 左上角,130,是你的模型认为是“a”的东西,实际上是“a”<-这些是正确的
  • 左下角,15,是你的模型认为是“a”但实际上是“b”的东西 <- 一种错误
  • 右上角,8,是你的模型认为是“b”但实际上是“a”的东西<-另一种错误
  • 右下角,150 是你的模型认为是“b”的东西,实际上是“b”

所以矩阵的左上角和右下角显示了你的模型正确的东西。

矩阵的左下角和右上角显示了您的模型混淆的地方。

于 2014-10-28T19:14:11.227 回答