7

我有以下格式的 xts

                   a        b     c        d       e        f   ......
2011-01-03         11.40    NA    23.12    0.23    123.11   NA  ......
2011-01-04         11.49    NA    23.15    1.11    111.11   NA  ......
2011-01-05         NA       NA    23.11    1.23    142.32   NA  ......
2011-01-06         11.64    NA    39.01    NA      124.21   NA  ......
2011-01-07         13.84    NA    12.12    1.53    152.12   NA  ......

有没有我可以应用的函数来生成一个新的 xts 或 data.frame 缺少仅包含 NA 的列?

具有 NA 的列的位置不是静态的,因此仅按名称或位置删除这些列是不可能的

4

4 回答 4

5

DF假设是你的data.frame

 DF [, -which(sapply(DF, function(x) sum(is.na(x)))==nrow(DF))]
               a     c    d      e
2011-01-03 11.40 23.12 0.23 123.11
2011-01-04 11.49 23.15 1.11 111.11
2011-01-05    NA 23.11 1.23 142.32
2011-01-06 11.64 39.01   NA 124.21
2011-01-07 13.84 12.12 1.53 152.12
于 2012-10-27T09:48:09.830 回答
5

@Jiber解决方案有效,但如果没有包含 all 的列,可能会给您带来意想不到的结果NA。例如:

# sample data
library(xts)
data(sample_matrix)
x <- as.xts(sample_matrix)

# Jiber's solution, when no columns have all missing values
DF <- as.data.frame(x)
DF[, -which(sapply(DF, function(x) sum(is.na(x)))==nrow(DF))]
# data frame with 0 columns and 180 rows

无论是否存在包含所有缺失值的列,以下解决方案都有效:

y <- x[,apply(!is.na(x), 2, all)]
x$High <- NA
x$Close <- NA
z <- x[,apply(!is.na(x), 2, all)]
于 2012-10-27T12:07:17.617 回答
2

试试这个:

dataframe[,-which(apply(is.na(dataframe), 2, all))]
于 2012-10-27T09:40:04.473 回答
2

这似乎更简单:

DF[, colSums(is.na(DF)) < nrow(DF)]
于 2012-10-27T11:10:31.223 回答