r - 如何使用 tidymodels 在我的结果变量中设置哪个级别是“事件”？

Question

我正在使用tidymodels进行机器学习，并且我想预测二进制响应/结果。如何指定结果的哪个级别是“事件”或正面案例？

这发生在食谱中还是其他地方？


##split the data
anxiety_split <- initial_split(anxiety_df, strata = anxiety)


anxiety_train <- training(anxiety_split)
anxiety_test <- testing(anxiety_split)


set.seed(1222) 
anxiety_cv <- vfold_cv(anxiety_train, strata = anxiety)

anxiety_rec <- recipe(anxiety ~ ., data = anxiety_train, positive = 'pos') %>%
  step_corr(all_numeric()) %>%
  step_dummy(all_nominal(), -all_outcomes()) %>%
  step_zv(all_numeric()) %>%
  step_normalize(all_numeric())

score 3 · Accepted Answer

在评估模型之前，您无需设置结果变量的哪个级别是“事件”。您可以使用event_level大多数标准函数的参数来做到这一点。例如，查看如何执行此操作yardstick::roc_curve()：

library(yardstick)
#> For binary classification, the first factor level is assumed to be the event.
#> Use the argument `event_level = "second"` to alter this as needed.
library(tidyverse)

data(two_class_example)


## looks good!
two_class_example %>%
  roc_curve(truth, Class1, event_level = "first") %>%
  autoplot()



## YIKES!! we got this backwards
two_class_example %>%
  roc_curve(truth, Class1, event_level = "second") %>%
  autoplot()

^{由reprex 包（v0.3.0.9001）于 2020-08-02 创建}

注意标准启动时的消息；假设第一个因子水平是事件。这类似于基础 R 的作用。您只需要担心event_level您的“事件”是否不是第一个因素级别。

r - 如何使用 tidymodels 在我的结果变量中设置哪个级别是“事件”？

1 回答 1

Related

Reference