我对调用 roc_curve 时要传递的列有疑问。如果您查看https://www.tidymodels.org/start/recipes/#predict-workflow提供的示例,您可以看到提供的参数是 .pred_late。
flights_pred %>%
roc_curve(truth = arr_delay, .pred_late) %>%
autoplot()
为什么使用它而不是 .pred_on_time?
对我来说价值.pred_on_time > 0.5
==> on_time
。我知道关系.pred_on_time+.pred_late=1
,但写起来更自然:
flights_pred %>%
roc_curve(truth = arr_delay, .pred_on_time) %>%
autoplot()