1

我在 Weka 实验环境中使用默认设置的 Adaboost M1 算法:

  1. 运行 (1-10) -> 10 次运行以提供更具统计意义的结果
  2. 随机拆分结果生成器
  3. 我使用训练百分比将训练与评估数据分开

现在,问题在于加权平均 TP 和 FP 结果。我明白了:

TP:0.8
FP:0.47

但据我所知,如果 TP 率为 0.8,FP 率应该高达 0.2?我假设这与 10 次运行有关,但无论如何,如果从这次运行中获取平均值,那么这个 FP 率应该会低得多吗?

抱歉,如果这是一个太简单的问题,但从我的逻辑来看,这似乎是 Weka 工具包中的错误,还是我错了?谢谢

编辑:

为了避免提出新问题并且因为这与同一个问题有关,任何人都可以回答 Weka 中显示的加权平均值是什么?

我在下面包含了 Atilla 的示例:可以看出加权平均值不是平均值,例如 AVG(0.933,0.422) != 0.77 等。

有人可以回答这些值实际上是什么吗?

=== 按等级划分的详细准确度 ===

         TP Rate  FP Rate  Precision  Recall  F-Measure  MCC    ROC Area  PRC Area  Class
         0.933    0.578    0.776      0.933   0.847      0.429  0.844     0.917     tested_negative
         0.422    0.067    0.745      0.422   0.538      0.429  0.844     0.696     tested_positive

加权平均 0.77 0.416 0.766 0.77 0.749 0.429 0.844 0.847

4

1 回答 1

1

我在 weka 的糖尿病数据集上使用默认参数运行 adoboostM1。我得到了以下结果。

=== Detailed Accuracy By Class ===

             TP Rate  FP Rate  Precision  Recall  F-Measure  MCC    ROC Area  PRC Area  Class
             0.933    0.578    0.776      0.933   0.847      0.429  0.844     0.917     tested_negative
             0.422    0.067    0.745      0.422   0.538      0.429  0.844     0.696     tested_positive
Weighted Avg.    0.77     0.416    0.766      0.77    0.749      0.429  0.844     0.847

请注意,此 TP 率和 FP 率适用于您的每个班级值。由于我在此数据集中有两 (2 ) 个类特征值,因此我有两 (2)行。

另请注意:

0.933  + 0.067 = 1 
0.578 + 0.422 = 1 

正如您正确指出的那样,TP 率 + FP 率应该等于一 (1)。所以在你的例子中:我假设你有以下类变量:

target {A,B}

TP Rate FP Rate 
0.8      0.47   ..... for A
0.53     0.2    ..... for B
于 2013-05-27T06:04:08.593 回答