背景
嗨,我想检查提供的dplyr
工作流程是否反映了 Taylor (2010) 所描述的均方误差估计器的计算。
问题
在哪里:
- 24反映了 Taylor 数据集中的观察总数。在提供数据的情况下,这将对应于每组10 个观察值。
数据
使用的数据相当简单,类似于摘录:
set.seed(123)
dta <- data.frame(group = rep(LETTERS[1:3], 10),
year = rep(2001:2010, 3),
value = round(runif(30),2))
建议的工作流程
工作流程草案将对应于代码:
# Pkgs
Vectorize(require)(package = c("dplyr", "magrittr"),
char = TRUE)
# Workflow
dta %<>%
arrange(group, year) %>%
group_by(group) %>%
mutate(X1 = cumsum(value) / row_number()) %>%
mutate(X2 = cumsum(lead(value)) / (length(value) - row_number())) %>%
mutate(MSEe = cumsum((value - X1) ^ 2 + (value - X2) ^ 2))
参考
Taylor,2010,变化点分析:检测变化的强大新工具可用:http ://www.variation.com/cpa/tech/changepoint.html