这是下面显示错误的代码。
from imblearn.under_sampling import NearMiss
nm = NearMiss()
X_res,y_res=nm.fit_sample(X,Y)
这是下面显示错误的代码。
from imblearn.under_sampling import NearMiss
nm = NearMiss()
X_res,y_res=nm.fit_sample(X,Y)
您可能正试图对不平衡的数据集进行欠采样。为此,您可以使用RandomUnderSampler
而不是NearMiss
.
试试下面的代码:
from imblearn.under_sampling import RandomUnderSampler
under_sampler = RandomUnderSampler()
X_res, y_res = under_sampler.fit_resample(X, y)
现在,您的数据集是平衡的。您可以使用y_res.value_counts()
.
干杯!
我的 conda 没有安装“imblearn”包,而是安装了一个名为“imbalanced-learn”的包,这就是它不获取数据的原因。但奇怪的是 jupyter notebook 没有告诉我“imblearn”没有安装。