0

我使用 SMOTE 对我的训练集进行过采样。在训练集中,除了数字特征外,每行还有多个分类属性,例如位置和类型。当我使用 SMOTE 重新采样数据时,如何将这些分类属性的分布与训练集中的分布进行比较?在 imblearn 的过采样策略中,sample_indices_ 使这成为可能,但我认为这在 SMOTE 中是不可能的。有没有办法解决这个问题?我们是否也可以让 SMOTE 基于分类属性创建合成示例?例如,在少数类实例较少的位置创建少数类样本?

4

0 回答 0