Weka 设置了默认的cutoff(即50%)来区分其两个类别的数据,并且可以通过Weka 界面中的SelectThreshold 分类器轻松地在不同的cutoff 上进行分类。现在在三类数据中,Weka 选择最高的概率,比如说从 0.333、0.421、0.246 的概率中,Weka 将选择 0.421。但在此类中,无法手动选择自定义截止值。有什么方法可以让我执行这项任务,或者有人可以帮助我理解多类数据中自定义截止的概念。
两类数据的例子
inst#, actual, predicted, error, probability distribution
1 1:+1 1:+1 *0.814 0.186
2 1:+1 1:+1 *1 0
3 1:+1 1:+1 *0.58 0.42
4 1:+1 2:-1 + 0.294 *0.706
5 1:+1 1:+1 *0.796 0.204
6 1:+1 1:+1 *0.989 0.011
7 1:+1 2:-1 + 0.294 *0.706
8 1:+1 1:+1 *0.814 0.186
三类数据示例
inst#, actual, predicted, error, probability distribution
1 1:+1 1:+1 *0.92 0.07 0.01
2 1:+1 1:+1 *0.97 0.03 0
3 1:+1 2:0 + 0.47 *0.52 0.01
4 1:+1 1:+1 *0.89 0.08 0.03
5 1:+1 1:+1 *0.643 0.338 0.02
6 1:+1 2:0 + 0.22 *0.73 0.05
7 1:+1 1:+1 *0.45 0.21 0.34
8 1:+1 3:-1 + 0.16 0.19 *0.65