0

根据其值的总和有条件地删除数据框列的好方法是什么?

例如,在以下数据框中,我想删除值总和为零的所有列。

df = data.frame(Dum1=c(0,0,0,1,0,0,0,0,0,0),
Dum2=c(0,0,0,0,0,0,0,0,0,0),
Dum3=c(0,0,0,1,0,1,0,0,0,0),
Dum4=c(0,0,0,0,0,0,0,0,0,0))

colSums(as.matrix(df))

Dum1 Dum2 Dum3 Dum4 
1    0    2    0 

Dum2 和 Dum4 都是零,所以我想放弃它们。不幸的是,在我的应用程序中,我不会事先知道哪些列的总和为零,或者我可以使用以下方法删除它们:

df$Dum2 <- NULL
df$Dum4 <- NULL

str(df)

'data.frame':   10 obs. of  2 variables:
 $ Dum1: num  0 0 0 1 0 0 0 0 0 0
 $ Dum3: num  0 0 0 1 0 0 0 0 0 0

任何帮助将不胜感激

4

2 回答 2

3
df0 <- df[, colSums(df) != 0]
于 2013-09-11T20:18:23.613 回答
2
df[,which(colSums(df) == 0)] <- list(NULL)
于 2013-09-11T20:17:39.637 回答