我的数据集有 200 多个变量,其中大多数都有表示缺失值的点:
19
岁
20 岁
。
56
23
R 会将点识别为 Null 值。所以当我使用
> library(Hmisc) # cut2
> split(data, cut2(data$Age, g=3))
将数据分成 3 个波段,我收到错误消息:
if (cj == upper) next 中的错误:需要 TRUE/FALSE 的缺失值
另外:警告消息:
1:在 cut2(data2$Household_Count, g = 10) 中:强制引入的 NA
2:在 Ops.factor(x , (lower - min.dif.factor * min.dif)) :对因子
3 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) :对因子
4 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子
5 没有意义: 在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子
6 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子
7 没有意义:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) : 对因子没有意义
8:在 Ops.factor(x, (lower - min.dif.factor * min.dif)) 中:对因子没有意义
9:在 Ops.factor(x, (lower - min.dif.factor * min.dif) ) : 对因子没有意义
我已确认此错误是由 Null 值引起的。但是,由于我在不同行中有太多带有点的变量,所以我不能简单地通过过滤来去除点。如何摆脱点并对每个变量执行“拆分”命令?