8

我想计算前几年不存在的新元素。在示例中

样本数据:

var1 <- list('2003' = 1:3, '2004' = c(4:3), '2005' = c(6,4,1), '2006' = 1:4 )

我想得到输出

newcount <- list('2003' = 0, '2004' = 1, '2005' = 1, '2006' = 0)

不成功的代码:

newcount <- mapply(setdiff, var1, seq_along(var1), function(i) 
            {if (i > 1) {Reduce(union, var1[i-1], accumulate=T)}}, length)
4

2 回答 2

5

差不多了,但最好使用矢量索引来处理偏移量并在之后添加始终已知的初始元素:

lapply(c(list(`2003`=integer(0)),
       mapply(setdiff,var1[-1], 
              Reduce(union,var1,accumulate=TRUE)[-length(var1)])),length)
$`2003`
[1] 0

$`2004`
[1] 1

$`2005`
[1] 1

$`2006`
[1] 0
于 2012-09-04T08:11:01.033 回答
4

假设它var1是按年份排序的,并且对于 2003 年你想要3而不是1,你可以尝试

newcount <- lapply(seq_along(var1),function(x){
  prev<-unlist(var1[seq_len(x-1)])
# Improvement suggested by plannapus
  sum(!var1[[x]]%in%prev) # length(which(!var1[[x]]%in%prev))
})

names(newcount)<-names(var1)

newcount
# $`2003`
# [1] 3

# $`2004`
# [1] 1

# $`2005`
# [1] 1

# $`2006`
# [1] 0

好的,如果您绝对确定 2003 应该是 0(我认为这是您的逻辑的一个例外),那么您可以执行以下操作:

newcount <- c(0, lapply(seq_along(var1)[-1],function(x){
  prev<-unlist(var1[seq_len(x-1)])
  sum(!var1[[x]]%in%prev)
}))
于 2012-09-04T08:11:32.863 回答