根据统计,看起来我有 672 个任务值。QuotedPremium 列中有 NULL 值。
我实现了 Clean Missing Data 模块,它应该用 0 替换缺失值,但由于某种原因,我仍然将 NULL 值视为 QuotedPremium,但是......它说缺失值 = 0
在这里你看到它告诉我缺失值 = 0,但仍有 NULL
那么在我运行 Clean Missing Data 模块之后到底发生了什么?为什么它运行成功但仍有 NULL 值,即使它告诉缺失值的数量为 0。
根据统计,看起来我有 672 个任务值。QuotedPremium 列中有 NULL 值。
我实现了 Clean Missing Data 模块,它应该用 0 替换缺失值,但由于某种原因,我仍然将 NULL 值视为 QuotedPremium,但是......它说缺失值 = 0
在这里你看到它告诉我缺失值 = 0,但仍有 NULL
那么在我运行 Clean Missing Data 模块之后到底发生了什么?为什么它运行成功但仍有 NULL 值,即使它告诉缺失值的数量为 0。
NULL
确实是一个值;包含 NULL 的条目不会丢失,因此它们既不会使用“清理缺失数据”运算符进行清理,也不会报告为缺失。
因为它们并不是真正的缺失值,所以它是一个字符串 NULL,它被添加到所有这些单元格中。因此,为了将这些值替换为 0,您可以在下面使用:
使用Execute R Script
模块,并在其中添加此代码。
dataset1 <- maml.mapInputPort(1); # class: data.frame
dataset1[dataset1 == "NULL"] = 0; # Wherever cell's value is "NULL", replace it with 0
maml.mapOutputPort("dataset1"); # return the modified data.frame
相同的图像: