6

我已经使用 Weka 3.7.9 将一个随机森林模型保存到一个文件中,现在我正在尝试将它与其他(非常大的)集合(在 Amazon EC2 中的一些大型机器上)进行评估。我正在使用以下命令行:

> java -server -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -T test.arff -l random-forest.model
-i -no-cv

但是,我唯一的输出是这样的:

=== Error on test data ===

Correctly Classified Instances     3252532               80.0686 %
Incorrectly Classified Instances    809651               19.9314 %
Kappa statistic                          0.2884
Mean absolute error                      0.2539
Root mean squared error                  0.3608
Coverage of cases (0.95 level)          98.7413 %
Total Number of Instances          4062183

而我正在寻找这样的东西:

=== Detailed Accuracy By Class ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.804    0.295    0.731      0.804    0.766      0.512    0.826     0.803     buyer
                 0.705    0.196    0.783      0.705    0.742      0.512    0.826     0.798     non-buyer
Weighted Avg.    0.755    0.245    0.757      0.755    0.754      0.512    0.826     0.801     

=== Confusion Matrix ===

     a     b   <-- classified as
 61728 15004 |     a = buyer
 22662 54066 |     b = non-buyer

请注意,即使我再次运行完整的训练方法,如下所示:

> java -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -t train.arff -T test.arff 
-I 10 -K 0 -S 1 -num-slots 8 -d random-forest.model -i -no-cv

我仍然没有显示测试数据的混淆矩阵(仅适用于训练数据)。

4

1 回答 1

3

当您省略该-no-cv选项时,它会起作用。

于 2013-03-23T20:25:04.100 回答