parsnip
我正在尝试使用and创建节点链接图(决策树)tidymodels
。我正在执行的是使用tidymodels
包和rpart
模型引擎为 StackOverflow 数据集构建决策树模型。该模型应remote
根据编程经验年数years_coded_job
(( )。career_satisfaction
data_scientist
company_size_number
我的管道
library(tidyverse)
library(tidymodels)
library(rpart.plot)
library(rpart)
library(rattle)
so <- read_rds(here::here("stackoverflow.rds"))
fit <- rpart(remote ~ years_coded_job + career_satisfaction + data_scientist + company_size_number,
data = so,
control = rpart.control(minsplit = 20, minbucket = 2))
fancyRpartPlot(fit, sub = "")
我得到的情节
我想知道这是否是确定预测变量的正确方法。由于我没有建立模型,这是正确的方法吗?