我正在完善我的数据框以消除无用的变量。我做的第一步是使用以下命令删除具有超过一半行作为 NA 值的列:
limit <- nrow(mydata)/2
mydata <- mydata[, which(as.numeric(colSums(!is.na(mydata))) > limit)]
我期待为零做同样的事情,但我找不到像“is.zero()”这样的函数,我该怎么做?
我期待做的另一件事是删除任何重复任何值超过“限制”次数的列(如果存在这样的命令,那将是理想的!)
非常感谢,