0

我正在使用“imblearn”库进行欠采样。我的数据集中有四个类,每个类有 20、30、40 和 50 个数据(因为它是一个不平衡的类)。

但是当我尝试使用“fit_resample(X, y)”对数据集进行欠采样时,它只会对第一个和最后一个类进行欠采样。

有什么方法可以使用“imblearn”对所有四个类进行欠采样?

必要代码:

undersample = RandomUnderSampler(sampling_strategy='majority')
X_over, y_over = undersample.fit_resample(X, y)
4

1 回答 1

0

设置smapling_strategy='all'解决了问题。

于 2020-06-01T09:01:35.170 回答