我有大量数据,一些信息丢失(NULL)。我应该在学习过程中跳过这个例子还是做其他事情?
问问题
256 次
1 回答
3
这实际上取决于数据以及您认为有意义的内容。如果您认为 NULL 信息可能有意义,一种选择是创建一个新变量来表示具有 NULL 数据的条目。例如,如果您有具有 NULL 值的真/假分类数据,例如
1, 0, 1, NULL, NULL, 1, 1, NULL
您可以将其转换为:
1 0 1 0 0 1 1 0 <- true
0 1 0 0 0 0 0 0 <- false
0 0 0 1 1 0 0 1 <- NULL
浮点值也可以做类似的事情。
当然,如果您认为它们为 NULL 的事实没有帮助,您也可以丢弃 NULL 值或用有根据的猜测(可能是平均值)替换它们。
于 2013-08-09T00:04:30.487 回答