我正在尝试使用 SMOTE 来处理二进制分类中不平衡的类数据,我所知道的是:例如,如果我们使用
sm = SMOTE(ratio = 1.0, random_state=10)
Before OverSampling, counts of label '1': [78]
Before OverSampling, counts of label '0': [6266]
After OverSampling, counts of label '1': 6266
After OverSampling, counts of label '0': 6266
对于第 1 类为少数的情况,将导致 50:50 的第 0 类和第 1 类数量
和
sm = SMOTE(ratio = 0.5, random_state=10)
Before OverSampling, counts of label '1': [78]
Before OverSampling, counts of label '0': [6266]
After OverSampling, counts of label '1': 3133
After OverSampling, counts of label '0': 6266
将导致类 1 的大小减半。
我的问题:
我们如何设置比率以使 1 类比 0 类获得更多,例如 75:25?