在计算混淆矩阵时是否有任何方法可以选择最佳阈值,以便最大限度地减少误报和误报的数量(以获得最佳组合)?
到目前为止,我已经尝试手动更改阈值,但这太累人了。
提前致谢。
在计算混淆矩阵时是否有任何方法可以选择最佳阈值,以便最大限度地减少误报和误报的数量(以获得最佳组合)?
到目前为止,我已经尝试手动更改阈值,但这太累人了。
提前致谢。
您可以使用 WEKA 来优化阈值。当模型的准确性最高时,将达到最佳阈值。否则也可以使用 ROC 曲线
我从某个地方复制了这段代码以获得最佳阈值。我认为它给出了这里的要求:
pred <- prediction(data$predicted_values, data$observations)
ss <- performance(pred, "sens", "spec")
plot(ss)
best_threshold <- ss@alpha.values[[1]][which.max(ss@x.values[[1]]+ss@y.values[[1]])]
希望它可以帮助