您通常如何从 Vowpal Wabbit 中针对分类问题创建的模型中获得准确率、召回率和 f 度量?
是否有任何可用的脚本或程序通常用于大众的输出?
使用 playtennis.txt 中的以下数据做一个最小的例子:
2 | sunny 85 85 false
2 | sunny 80 90 true
1 | overcast 83 78 false
1 | rain 70 96 false
1 | rain 68 80 false
2 | rain 65 70 true
1 | overcast 64 65 true
2 | sunny 72 95 false
1 | sunny 69 70 false
1 | rain 75 80 false
1 | sunny 75 70 true
1 | overcast 72 90 true
1 | overcast 81 75 false
2 | rain 71 80 true
我使用以下方法创建模型:
vw playtennis.txt --oaa 2 -f playtennis.model --loss_function logistic
然后,我通过以下方式获得训练模型对训练数据本身的预测和原始预测:
vw -t -i playtennis.model playtennis.txt -p playtennis.predict -r playtennis.rawp
从这里开始,在给定训练数据playtennis.txt
和对训练数据的预测的情况下,您通常使用哪些脚本或程序来获得精度、召回率和 f 测量playtennis.predict
?
此外,如果这是一个多标签分类问题(每个实例可以有多个目标标签,vw 也可以处理),您提出的脚本或程序是否能够处理这些问题?