我正在使用 R 处理非常不平衡的奥林匹克数据集,并且正在寻找一种适当平衡数据的方法。
在研究了一些之后,我发现 ROSE 工作得很好,但是只有 2 个类。我的输出有 4 个等级(Gold、Silver、Bronze、NoMedal),所以 ROSE 不起作用。有人告诉我尝试使用 SMOTE 函数,但是,我不确定在处理 4 个类时如何使用它。目前,我的课程包含 13k 金、13K 银、13K 铜和 232K NoMedal。
关于如何使用 SMOTE 来平衡这 4 个类的任何想法?
我正在使用 R 处理非常不平衡的奥林匹克数据集,并且正在寻找一种适当平衡数据的方法。
在研究了一些之后,我发现 ROSE 工作得很好,但是只有 2 个类。我的输出有 4 个等级(Gold、Silver、Bronze、NoMedal),所以 ROSE 不起作用。有人告诉我尝试使用 SMOTE 函数,但是,我不确定在处理 4 个类时如何使用它。目前,我的课程包含 13k 金、13K 银、13K 铜和 232K NoMedal。
关于如何使用 SMOTE 来平衡这 4 个类的任何想法?