0

这有效:

onion$yearone$id %in% mask$yearone

这不会:

onion[1][1] %in% mask[1]
onion[1]['id'] %in% mask[1]

为什么?缺乏一种在 DF 和 memberids 中的并行列中矢量化的明显方法(所以当 DF 和 memberids 中都存在 ids 时,我每年只得到行),我使用 for 循环,但我没有幸运地找到表示索引的正确方法...帮助?

示例数据:

yearone <- data.frame(id=c("b","b","c","a","a"),v=rnorm(5))
onion <- list()
onion[[1]] <- yearone
names(onion) <- 'yearone'
mask <- list()
mask[[1]] <- c('a','c')
names(mask) <- 'yearone'
4

3 回答 3

3

'$' 运算符与 '[' 运算符不同。如果“yearone”和“ids”实际上是这些列表中的第一项,您应该看到这与第一次调用的结果相同:

DF[[1]][[1]] %in% memberids[[1]]

为什么我们应该认为访问yearpathall应该给出相同的结果在这一点上完全不清楚,但是使用“[[”运算符可能会给出一个原子向量,而使用“[”肯定不会。"[" 运算符总是返回与其第一个参数相同的类的结果,因此在这种情况下,对于 'DF' 和 'memberids' 来说,它将是一个列表而不是一个向量。%in% 运算符只是一个中缀版本 fomatch并且需要一个原子向量作为它的两个参数

于 2012-09-27T07:30:59.150 回答
1

这是一种使用方法Map

# some data
onion <- replicate(5,data.frame(id = sample(letters[1:3], 5,T), v = 1:5), 
                   simplify = F)
mask <- replicate(5, sample(letters[1:3],2), simplify = F)
names(onion) <- names(mask) <- paste0('year', seq_along(onion))

将进行匹配的函数

get_matches <- function(data, id, mask){
   rows <- data[[id]] %in% mask
   data[rows,]
}


Map(get_matches , data = onion, mask = mask, MoreArgs = list(id = 'id'))
于 2012-09-27T23:59:23.460 回答
0

这似乎是我正在寻找的答案:

merge(mask[1],onion[[1]], by.x = names(mask[1]), by.y = names(onion[[1]][1]))

并应用于数据帧的并行列表:

result <- list()
for (i in 1:(length(names(onion)))) {
  result[[i]] <- merge(mask[i],onion[[i]], by.x = names(mask[i]), by.y = names(onion[[i]][1]))
}
于 2012-09-27T23:17:33.013 回答