我正在使用“imblearn”库进行欠采样。我的数据集中有四个类,每个类有 20、30、40 和 50 个数据(因为它是一个不平衡的类)。
但是当我尝试使用“fit_resample(X, y)”对数据集进行欠采样时,它只会对第一个和最后一个类进行欠采样。
有什么方法可以使用“imblearn”对所有四个类进行欠采样?
必要代码:
undersample = RandomUnderSampler(sampling_strategy='majority')
X_over, y_over = undersample.fit_resample(X, y)