我在包含约 55800 个样本的数据集上使用不同的imblearn过采样方法。大约 200 个是 1 类,其余是 0 类。我正在使用各种过采样策略对 1 类进行过采样。
它不会提高我的模型质量,因此我不想仔细查看生成的样本。但是如何访问它们?有什么方法可以获取创建的索引吗?
在采样之前和之后循环遍历示例列表,过滤掉非重复项,这要求太高了,并且冻结了我的笔记本电脑。
我在包含约 55800 个样本的数据集上使用不同的imblearn过采样方法。大约 200 个是 1 类,其余是 0 类。我正在使用各种过采样策略对 1 类进行过采样。
它不会提高我的模型质量,因此我不想仔细查看生成的样本。但是如何访问它们?有什么方法可以获取创建的索引吗?
在采样之前和之后循环遍历示例列表,过滤掉非重复项,这要求太高了,并且冻结了我的笔记本电脑。