0

我在数据帧上使用填充(来自padr包)来填充时间间隔。现在,为了填补一组指定列的空白值,我使用fill_by_function. 通常,fill_by_function将不带引号的列名作为参数。但是,在我的例子中,我得到了一个列名列表。

我的问题是,我将如何在fill_by_function函数中传递列列表。请注意,列的列表不是预定义的,所以我不能硬编码fill_by_function.

以下是我尝试过的示例,但出现错误。

x <- seq(as.Date('2016-01-01'), by = 'day', length.out = 366)
x <- x[sample(1:366, 200)] %>% sort
x.df <- data.frame(x  = x,
               y1 = runif(200, 10, 20) %>% round,
               y2 = runif(200, 1, 50) %>% round,
               y3 = runif(200, 20, 40) %>% round)

c.list <- c("y1","y2")
x.df %>% pad %>% fill_by_function(as.name(c.list),fun=mean)

以下是我收到的错误消息

Error in inds[i] <- which(colnames_x == as.character(cols[[i]])) : replacement has length zero

我可以使用任何其他替代功能吗

4

1 回答 1

0

这对我有用:

x.df %>% pad %>% fill_by_function(.cols=c.list,fun=mean) %>% tail(.)

             x     y1    y2    y3
361 2016-12-26 14.725 24.31 30.09
362 2016-12-27 14.000 28.00 21.00
363 2016-12-28 14.725 24.31 30.09
364 2016-12-29 15.000 47.00 22.00
365 2016-12-30 14.000 43.00 34.00
366 2016-12-31 17.000 14.00 21.00

相比于:

x.df %>% pad %>% fill_by_function(y1,fun=mean) %>% tail(.)

             x     y1 y2 y3
361 2016-12-26 14.725 NA NA
362 2016-12-27 14.000 28 21
363 2016-12-28 14.725 NA NA
364 2016-12-29 15.000 47 22
365 2016-12-30 14.000 43 34
366 2016-12-31 17.000 14 21

检查输出是否真的是你想要的。

于 2017-06-18T20:28:42.820 回答