1

我正在使用 SMOTE 对我的数据集进行过采样(受类不平衡的影响)。我的一些属性具有整数值,其他属性只有两位小数,但 SMOTE 创建具有许多小数的新实例。所以为了解决这个问题,我想使用 NumericCleaner 过滤器并设置我想要的小数位数。这似乎可行,但我遇到了缺失值的问题。每个缺失值都替换为 0.0 值,我需要使用数据集中的缺失值来评估我的模型。那么如何使用 NumericCleaner(或其他允许舍入值的过滤器)并保留我的缺失值?

4

1 回答 1

1

非常有趣的问题。好的,这是解决方案:

  1. 使用 SMOTE 对少数群体进行过采样(这会产生小数点,但缺失值仍然是缺失值)
  2. 然后选择 weka filter->unsupervised->attribute->NumericTransform
  3. 然后单击此过滤器并设置属性实例(您具有小数点功能的地方)并在 methodName 而不是“abs”中输入“ceil”。

我希望这能解决问题。

于 2012-04-20T14:34:23.033 回答