1

在我的数据集中,目标变量是标称的(只有两种状态),其他都是数字的。数据集高度不平衡。在寻找处理不平衡数据集的解决方案后,我发现了 SMOTE(Synthetic Minority Over-sampling Technique)。应用 SMOTE 算法后数据集的大小会增加(我使用了该算法的 Weka 实现)。

现在我的问题是,在这种不平衡的数据集中,如何确定对目标变量影响最大的重要特征/属性?这种算法有没有可用的实现?

4

0 回答 0