我有一个函数,它需要一个数据框和几个变量,我希望它使用整洁的评估原则产生一组滞后变量。在它的简单形式中,它看起来像这样:
library(dplyr)
cor_lags <- function(df, var1, var2) {
var1 <- enquo(var1)
var2 <- enquo(var2)
df %>%
select(!!var1, !!var2) %>%
mutate(lag1 = lag(!!var2, 1),
lag2 = lag(!!var2, 2),
lag3 = lag(!!var2, 3),
lag4 = lag(!!var2, 4),
lag5 = lag(!!var2, 5),
lag6 = lag(!!var2, 6))
}
但是,这会NA
为所有滞后变量生成值。
cor_lags(dts_wide,"P26","P1")
# A tibble: 24 x 8
P26 P1 lag1 lag2 lag3 lag4 lag5 lag6
<dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr>
1 84332. 2258. NA NA NA NA NA NA
2 63995. 2752. NA NA NA NA NA NA
3 86208. 10126. NA NA NA NA NA NA
4 103455. 3767. NA NA NA NA NA NA
5 160524. 12986. NA NA NA NA NA NA
6 306683. 3944. NA NA NA NA NA NA
7 599589. 3695. NA NA NA NA NA NA
8 642343. 6202. NA NA NA NA NA NA
9 482021. 8769. NA NA NA NA NA NA
10 220949. 5059. NA NA NA NA NA NA
有没有理由!!评估员不在lag
通话范围内工作?他们显然在select
通话中工作。
上述调用的预期行为在实践中应该像这段代码一样工作(有效):
# Expected
cor_lags <- function(df, var1, var2) {
var1 <- enquo(var1)
var2 <- enquo(var2)
df %>%
select(!!var1, !!var2) %>%
mutate(lag1 = lag(P1, 1),
lag2 = lag(P1, 2),
lag3 = lag(P1, 3),
lag4 = lag(P1, 4),
lag5 = lag(P1, 5),
lag6 = lag(P1, 6))
}
正如预期的那样,它会产生:
cor_lags(dts_wide,"P26","P1")
# A tibble: 24 x 8
P26 P1 lag1 lag2 lag3 lag4 lag5 lag6
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 84332. 2258. NA NA NA NA NA NA
2 63995. 2752. 2258. NA NA NA NA NA
3 86208. 10126. 2752. 2258. NA NA NA NA
4 103455. 3767. 10126. 2752. 2258. NA NA NA
5 160524. 12986. 3767. 10126. 2752. 2258. NA NA
6 306683. 3944. 12986. 3767. 10126. 2752. 2258. NA
7 599589. 3695. 3944. 12986. 3767. 10126. 2752. 2258.
8 642343. 6202. 3695. 3944. 12986. 3767. 10126. 2752.
9 482021. 8769. 6202. 3695. 3944. 12986. 3767. 10126.
10 220949. 5059. 8769. 6202. 3695. 3944. 12986. 3767.