0

我的数据集有 200 多个变量,其中大多数都有表示缺失值的点:

19

20 岁

56
23

R 会将点识别为 Null 值。所以当我使用

> library(Hmisc) # cut2
> split(data, cut2(data$Age, g=3))

将数据分成 3 个波段,我收到错误消息:

if (cj == upper) next 中的错误:需要 TRUE/FALSE 的缺失值
另外:警告消息:
1:在 cut2(data2$Household_Count, g = 10) 中:强制引入的 NA
2:在 Ops.factor(x , (lower - min.dif.factor * min.dif)) :对因子
3 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) :对因子
4 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子
5 没有意义: 在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子
6 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子
7 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) : 对因子没有意义
8:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子没有意义
9:在 Ops.factor(x, (lower - min.dif.factor * min.dif) ) : 对因子没有意义

我已确认此错误是由 Null 值引起的。但是,由于我在不同行中有太多带有点的变量,所以我不能简单地通过过滤来去除点。如何摆脱点并对每个变量执行“拆分”命令?

4

1 回答 1

0

您可以complete.cases在使用之前删除 NA 或缺失值cut。看?complete.cases

例子:

y <- airquality[,  1]
yy<-y[complete.cases(y)]
yyy<-cut(yy,3)
于 2013-08-21T22:33:26.200 回答