1

我有一个 6,000 obs 的 data.frame

SubjectID  : int   1,2,3,4...
Arthritis  : logi  FALSE FALSE TRUE FALSE FALSE
Stroke     : logi  TRUE FALSE FALSE FALSE FALSE
Diabetes   : logi  TRUE FALSE FALSE FALSE FALSE
Cancer     : logi  FALSE FALSE FALSE FALSE TRUE

我试图找到不存在每种疾病的行。我可以用这个来治疗一种疾病:

subset(RHV.FINAL, Arthritis=="FALSE")

我已经为所有疾病尝试过这个方法,它有效,但很麻烦:

subset(RHV.FINAL, Arthritis=="FALSE" & Stroke=="FALSE" & Diabetes=="FALSE" & Cancer=="FALSE")

有没有更有说服力的解决方案?

4

1 回答 1

3

不能用rowSums吗?str当您发布数据时,很难用您的数据来判断。在 R 会话中重新创建一个小例子会很好 ( dput)。

df [rowSums( df ) == 0 , ]

例如...

set.seed(123)
df <- data.frame( id = 1:5,
            A = sample( c(T,F) , 5 , repl = T ),
            B = sample( c(T,F) , 5 , repl = T ),
            C = sample( c(T,F) , 5 , repl = T ))

  id     A     B     C
1  1  TRUE  TRUE FALSE
2  2 FALSE FALSE  TRUE
3  3  TRUE FALSE FALSE
4  4 FALSE FALSE FALSE
5  5 FALSE  TRUE  TRUE


# df[,-1] to exclude id variable in first column (thanks @DidzisElferts)
df[ rowSums(df[,-1]) == 0 , ] 
  id     A     B     C
4  4 FALSE FALSE FALSE
于 2013-08-15T11:42:29.670 回答