0

我正在尝试对贷款违约数据集进行逻辑回归,并想知道为什么 SMOTE 减少了观察次数。原始数据集有 .226786 个观测值,当我运行 smote 时,观测值总数减少到 53440 个。这是正常的吗?

train$loan_status<-as.factor(train$loan_status)
train_smote <-SMOTE(loan_status~.,train,perc.over = 100,k = 5, perc.under = 200)

0 1 26720 26720

谢谢

4

0 回答 0