我想重新采样我的数据集。这包括具有 3 个类别标签的分类转换数据。每类样本数量为:
- A类计数:6945
- B类计数:650
- C类计数:9066
- 样本总数:16661
没有标签的数据形状是 (16661, 1000, 256)。这意味着 (1000,256) 的 16661 个样本。我想要的是将数据上采样到多数类的样本数,即A类->(6945)
但是,调用时:
from imblearn.over_sampling import SMOTE
print(categorical_vector.shape)
sm = SMOTE(random_state=2)
X_train_res, y_labels_res = sm.fit_sample(categorical_vector, labels.ravel())
它一直说 ValueError: Found array with dim 3. Estimator expected <= 2.
如何以估算器可以拟合并且也有意义的方式展平数据?此外,在获得 X_train_res 后如何展开(使用 3D 维度)?