我使用 SMOTE 对数据进行过度采样,如下所示:
>>> from imblearn.over_sampling import SMOTE
>>> X_resampled, y_resampled = SMOTE().fit_resample(X, y)
所以现在X_resampled, y_resampled
都比原始数据集大。如何区分合成样本中的原始数据?
我使用 SMOTE 对数据进行过度采样,如下所示:
>>> from imblearn.over_sampling import SMOTE
>>> X_resampled, y_resampled = SMOTE().fit_resample(X, y)
所以现在X_resampled, y_resampled
都比原始数据集大。如何区分合成样本中的原始数据?