1

在 RI 中有一个带有一些缺失值的数据框,因此该read.table()函数使用NAs 而不是空白单元格。

我写了这个:

a <- sample(1000:50000000, size=120, replace=TRUE)
values <- matrix(a, nrow=6, ncol=20)
mtx <- cbind.data.frame(values, c(rep(NA),6))
mtx <- apply(mtx, 2, function(x){
    if (x==NA) sample(100:500, replace=TRUE, size=nrow(mtx)) else (x)})

但我有这个错误:

Error in if (x == NA) sample(100:500, replace = TRUE, size = nrow(mtx)) else (x) : 
  missing value where TRUE/FALSE needed
In addition: Warning message:
In if (x == NA) sample(100:500, replace = TRUE, size = nrow(mtx)) else (x) :
  the condition has length > 1 and only the first element will be used

有任何想法吗?

最好的里卡多

4

1 回答 1

8

由于值存在或缺失的原因,您无法测试是否NA使用比较运算符。是以 的形式识别缺失的适当函数。NAis.na()NA

NA这是在矩阵中替换的示例values。这里的关键是以矢量化方式工作,只需确定哪些元素NA随后被索引,以将所有元素替换为NA您需要的值。

> set.seed(2)
> values <- matrix(sample(1000:50000000, size=120, replace=TRUE),
+                  nrow=6, ncol=20)
> ## add some NA to simulate
> values[sample(120, 20)] <- NA
> 
> ## how many NA
> (tot <- sum(is.na(values)))
[1] 20
> 
> ## replace the NA
> values[is.na(values)] <- sample(100:500, tot, replace=TRUE)
> 
> ## now how many NA
> (sum(is.na(values)))
[1] 0
于 2012-06-21T14:52:37.517 回答