0

对于类似于下面的数据框(但显然更大))我想从向量中添加缺失的周数(向量在下面命名为周)。最后,var1 的每个值应该有 4 行,包括第 40 - 42 周,因此对于 var1 的不同值,插入的周值可能不同。最初插入的行可以具有值NA,但作为第二步,我想na.locf对 var1 的每个值执行。有谁知道如何做到这一点?

数据框示例:

dat <- data.frame(var1 = rep(c('a','b','c','d'),3),
                  week = c(rep(40,4),rep(41,4),rep(42,4)),
                  value = c(2,3,3,2,4,5,5,6,8,9,10,10))
dat <- dat[-c(6,11), ]

weeks <- c(40:42)
4

2 回答 2

1

像这样?

dat %>% 
   tidyr::complete(var1,week) %>% 
   group_by(var1) %>% 
   arrange(week) %>% 
   tidyr::fill(value)
# A tibble: 12 x 3
# Groups:   var1 [4]
   var1   week value
   <fct> <dbl> <dbl>
 1 a        40     2
 2 a        41     4
 3 a        42     8
 4 b        40     3
 5 b        41     3
 6 b        42     9
 7 c        40     3
 8 c        41     5
 9 c        42     5
10 d        40     2
11 d        41     6
12 d        42    10
于 2018-12-06T14:06:15.817 回答
0

嗨,您是否考虑过 tidyr::complete 和 dplyr::fill()。

library(dplyr)
library(tidyr)

complete(dat, week = 40:42, var1 = c("a", "b", "c", "d")) %>% fill(value, .direction = 
"down")
于 2018-12-06T14:10:02.830 回答