Halo,我是数据挖掘领域的新手,但是,我的数据不平衡,我使用 smote 使我的数据平衡并准备用于决策树。这是我的代码
Data1<-data%>%select(c(sex,usia,status))
Data1$status<-as.factor(Data1$status)
Data1<-data.frame(Data1)
Data1
str(Data1)
#==SMOTE==#
set.seed(15)
balanced.data1 <- SMOTE(status~.,Data1, perc.over = 1400, k = 5, perc.under =
110)
as.data.frame(table(balanced.data1$status))
balanced.data1
str(balanced.data1$sex)
#==TREE==#
fitControl1 <- trainControl(method = 'loocv')
balanced.data1<-data.frame(balanced.data1)
dt_model_smote1 <- caret::train(status~.,
data.frame(balanced.data1),
method = 'rpart',
tuneLength = 5,
trControl=fitControl1)
dt_model_smote1
结果是我的balanced_data1 在预测变量上具有NA 值,即性别和usia。因此,我无法在我的决策树上工作。我该如何解决这种情况?