我有一个 48000 的图像数据集,其中 40k 正常类和 8k 异常实例。为了使数据集平衡,我需要对多数类进行欠采样。虽然我使用了 sklearn imblearn 随机欠采样方法,效果很好,但我需要在删除大多数实例的同时保留行的顺序(图像序列)。
我有一个 48000 的图像数据集,其中 40k 正常类和 8k 异常实例。为了使数据集平衡,我需要对多数类进行欠采样。虽然我使用了 sklearn imblearn 随机欠采样方法,效果很好,但我需要在删除大多数实例的同时保留行的顺序(图像序列)。