7

我们如何解释 WEKA 中的成本矩阵?如果我有 2 个要预测的类(0 类和 1 类)并且想要将 0 类的分类惩罚为 1 类更多(比如加倍惩罚),那么矩阵格式到底是什么?

是吗 :

 0 10
20  0

或者是

 0 20
10  0

混淆的来源是以下两个参考:

1) Weka CostMatrix 的 JavaDoc 说:

矩阵中位置 i,j 处的元素是将类 j 的实例分类为类 i 的惩罚。

2)但是,这篇文章中的答案似乎另有说明。

http://weka.8497.n7.nabble.com/cost-matrix-td5821.html

给定第一个成本矩阵,帖子说“错误分类 0 类的实例会产生 10 的成本。错误分类 1 类的实例的成本是原来的两倍。

谢谢。

4

1 回答 1

7

我知道我的答案来得太晚了,但它可能会对某人有所帮助,所以这里是:

为了提高将 0 类项目分类为 1 类的成本,正确的格式是第二种。

证据:

我使用的成本矩阵:

 0        1.0
 1000.0   0

混淆矩阵(来自交叉验证):

   a   b   <-- classified as
 565  20 |   a = ignored
  54 204 |   b = not_ignored

交叉验证输出:

...
Total Cost                           54020
...

这是 的成本54 * 10000 + 20 * 1,与上面的混淆矩阵相匹配。

于 2014-08-20T15:37:12.927 回答