r - 如何对存储在列表中的 data.frames 进行子集化？

Question

我创建了一个列表，并在每个组件中存储了一个数据框。现在我想过滤那些数据框，只保留特定列中具有 NA 的行。我希望这个操作的结果是另一个包含数据框的列表，其中只有那些行在该列中具有 NA。

这是一些代码来澄清我在说什么。假设d1并且d2是我的数据框

set.seed(1)

d1<-data.frame(a=rnorm(5), b=c(rep(2006, times=4),NA))
d2<-data.frame(a=1:5, b=c(2007, 2007, NA, NA, 2007))  

print(d1)
 a    b
 1.3011543 2006
 0.3780023 2006
-0.3101449 2006
-1.3927445 2006
-1.0726218   NA

print(d2)
a    b
1 2007
2 2007
3   NA
4   NA
5 2007

我把它放在一个带有 for 循环的列表中

ls<-list()

for (i in 1:2){ 

  str<-paste("d", i, sep="")
  dat<-get(str)
  ls[[str]]<-dat

}

现在我想过滤每个列表组件，以便只留下包含 NA 的列 b 行。为此，我尝试使用以下命令，从一开始就知道它会失败。我的问题是我不知道是否subset()使用正确的函数，如果是，我不知道如何限定每个数据帧（即子集函数的第一个元素）

lsNA<-lapply(ls, subset(ls, is.na(b)))

你能帮我克服我的严重限制吗？

score 17 · Accepted Answer

lapply的第二个参数是一个函数 ( subset)，额外subset的参数作为...参数传递给lapply. 因此：

my.ls <- list(d1 = d1, d2 = d2)
my.lsNA <- lapply(my.ls, subset, is.na(b))

（我还将向您展示如何在不使用的情况下轻松创建 data.frames 列表get，并建议您不要将ls其用作变量名，因为它也是一个相当常见的函数的名称。）

score 6 · Accepted Answer

关于@Riccardo 最后评论中的问题，请尝试：

lapply(my.ls, "[", 1)

或者：

lapply(my.ls, "[[", 1)

取决于您希望输出是数据帧列表还是向量列表。

r - 如何对存储在列表中的 data.frames 进行子集化？

2 回答 2

Related

Reference