抱歉,我是 WEKA 的新手,刚刚学习。
在我的决策树(J48)分类器输出中,有一个混淆矩阵:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
- 我如何阅读这个矩阵?a和b有什么区别?
- 另外,谁能向我解释什么是域值?
抱歉,我是 WEKA 的新手,刚刚学习。
在我的决策树(J48)分类器输出中,有一个混淆矩阵:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
你读过关于混淆矩阵的维基百科页面吗?在他们的示例中,矩阵周围的文本排列方式略有不同(行标签在左边而不是在右边),但你读起来是一样的。
行表示真实类,列表示分类器输出。然后,每个条目给出<row>
被分类为的实例数<column>
。在您的示例中,15 个 B 被(错误地)归类为 As,150 个 B 被正确归类为 B,等等。
结果,所有正确的分类都在左上角到右下角的对角线上。对角线之外的所有东西都是某种不正确的分类。
编辑:维基百科页面已经切换了行和列。有时候是这样的。在研究混淆矩阵时,请务必检查标签以查看它是否是行中的真实类、列中的预测类或其他方式。
我会这样说:
混淆矩阵是 Weka 报告这个 J48 模型在正确和错误方面的表现。
在您的数据中,目标变量是“功能性”或“非功能性”;矩阵的右侧告诉您“a”列是功能性的,而“b”是非功能性的。
这些列告诉您模型如何对样本进行分类 - 这是模型预测的:
另一方面,行代表现实:
了解了列和行,您可以深入了解细节:
所以矩阵的左上角和右下角显示了你的模型正确的东西。
矩阵的左下角和右上角显示了您的模型混淆的地方。