0

我正在尝试估算缺失值,但在处理分类变量时遇到问题。该命令softImpute计算缺失值,但它们也会变成分类变量,这对于分析来说是不够的。对于缺失值,我做了以下

>softImp = softImpute(as.matrix(train), rank.max = 60)
>data.comp = softImp$u %*% diag(softImp$d) %*% t(softImp$v)
>data.comp=data.frame(data.comp)

但是,当我查看分类变量时,它们是小数点

> head(data.comp$X91)
[1] 0.6037109 0.6263665 0.5373208 0.6092270 0.8796817 0.8643236

原来是

> head(train[c(91)])
  H0001600
1        0
2        0
3        1
4        1
5        0
6        1

是否有某种方法可以估算分类变量的缺失值?I 处理分类变量中缺失值的任何其他建议也会有很大帮助。

4

0 回答 0