-1

我有大量数据,一些信息丢失(NULL)。我应该在学习过程中跳过这个例子还是做其他事情?

4

1 回答 1

3

这实际上取决于数据以及您认为有意义的内容。如果您认为 NULL 信息可能有意义,一种选择是创建一个新变量来表示具有 NULL 数据的条目。例如,如果您有具有 NULL 值的真/假分类数据,例如

1, 0, 1, NULL, NULL, 1, 1, NULL

您可以将其转换为:

1  0  1  0  0  1  1  0  <- true
0  1  0  0  0  0  0  0  <- false
0  0  0  1  1  0  0  1  <- NULL

浮点值也可以做类似的事情。

当然,如果您认为它们为 NULL 的事实没有帮助,您也可以丢弃 NULL 值或用有根据的猜测(可能是平均值)替换它们。

于 2013-08-09T00:04:30.487 回答