0

我正在学习如何在项目中使用 Rapidminer。我在某个时候卡住了。我有一个数据集如下:有国家。对于每个国家,我都在跟踪 1990-2012 年的一些价值观(比如说奖牌)。举个例子:

  • 国年金银铜


    USA      1990    10      5         7
    .....
    USA      2012    12      3         8
    Spain    1990    8       12        9
    ...
    Spain    1992    7       ?         8
    ....
    Spain    2012    4       11        12
    ...GOES ON...
    

我想要做的是替换缺失值。例如,西班牙在 1992 年的银牌上有缺失值。我想找到西班牙可用的 Silver 数据的平均值,并用它替换缺失的值。我怎样才能做到这一点?如果 Rapidminer 中的当前模块无法做到这一点,是否有某种宏等?我也可以使用 Excel 来预处理数据(但如何)???。

4

1 回答 1

1

使用Replace Missing Values运算符。它的默认设置用该列的平均值填充任何缺失的数据——这正是你想要的。

于 2012-11-13T11:30:26.293 回答