这是我的玩具数据和代码。如何在不丢失原始变量的情况下离散化数值变量?
library(gapminder); library(tidyverse); library(tidymodels)
gapminder %>%
recipe(lifeExp ~ .) %>%
step_discretize(all_numeric(), -all_outcomes(), options = list(cuts = 10)) %>%
prep() %>%
juice()
在上面的代码中,我从 pop 和 gdpPercap 中丢失了原始值,因为它们被各自的离散化版本替换。如何同时保留:原始数值和离散变量?
其次,不是bin01,bin02,没有办法获得[0-100],[101-150]等类型的bin,所以我知道哪个bin有什么值?