python - sklearn：随机删除多数类而不改组数据集

翻译自：https://stackoverflow.com/questions/54801392 2019-02-21T07:24:24.210

110 次

我有一个 48000 的图像数据集，其中 40k 正常类和 8k 异常实例。为了使数据集平衡，我需要对多数类进行欠采样。虽然我使用了 sklearn imblearn 随机欠采样方法，效果很好，但我需要在删除大多数实例的同时保留行的顺序（图像序列）。

0 回答 0