18

我想在 R 中创建一个数据框的子集,该子集基于一列因子中的一个或另一个值,但似乎我不能|与因子值一起使用。

例子:

# fake data
x <- sample(1:100, 9)
nm <- c("a", "a", "a", "b", "b", "b", "c", "c", "c")
fake <- cbind(as.data.frame(nm), as.data.frame(x))
# subset fake to only rows with name equal to a or b
fake.trunk <- fake[fake$nm == "a" | "b", ]

产生错误:

Error in fake$nm == "a" | "b" : 
operations are possible only for numeric, logical or complex types

我怎样才能做到这一点?

显然,我的实际数据框在因子列中有超过 3 个值,因此仅使用是!= "c"行不通的。

4

2 回答 2

28

你需要fake.trunk <- fake[fake$nm == "a" | fake$nm == "b", ]. 一种更简洁的写作方式(尤其是在两个以上的条件下)是:

fake[ fake$nm %in% c("a","b"), ]
于 2011-04-15T18:27:52.673 回答
14

另一种方法是使用subset()和编写

fake.trunk = subset(fake, nm %in% c('a', 'b'))
于 2011-04-15T18:30:54.687 回答