我在 R 中第一次使用 smote
我在大多数类为 0 - 7952346 和少数类为 1- 27230 的火车数据上使用 smote,我想进行下采样,以便我有 1 接近 30000 和 0 接近这个范围 180000-200000。
我无法做到这一点,有人可以帮我解决这个问题,我尝试使用不同的参数,但没有得到想要的正确结果。
table(train$ModelLabel)
0 1
7952346 27230
train2 <- SMOTE(ModelLabel ~ .,train, perc.over=100,perc.under = 600)
table(train2$ModelLabel)
0 1
163380 54460
train2 <- SMOTE(ModelLabel ~ .,train, perc.over=5,perc.under = 600)
table(train2$ModelLabel)
0 1
8166 28591
train2 <- SMOTE(ModelLabel ~ .,train, perc.over=5,perc.under = 10)
table(train2$ModelLabel)
0 1
136 28591
train2 <- SMOTE(ModelLabel ~ .,train, perc.over=25,perc.under = 0)
table(train2$ModelLabel)
0 1
0 34037
train2 <- SMOTE(ModelLabel ~ .,train, perc.over=25,perc.under = 400)
table(train2$ModelLabel)
0 1
27228 34037