我的数据是 988、785 obs。3 个变量。我的数据的一个较小的例子如下:
Names <- c("Jack", "Jill", "John")
RawAccelData <- data.frame(
Sample = as.numeric(rep(1:60000, each = 3)),
Acceleration = rnorm(6000),
ID = rep((Names), each = 60000)
)
我的设备的采样率为 100 Hz。我希望在 1 到 10 秒的时间内计算Acceleration
每个的滚动平均值。ID
我使用以下方法执行此操作:
require(dplyr)
require(zoo)
for (summaryFunction in c("mean")) {
for ( i in seq(100, 1000, by = 100)) {
tempColumn <- RawAccelData %>%
group_by(ID) %>%
transmute(rollapply(Acceleration,
width = i,
FUN = summaryFunction,
align = "right",
fill = NA,
na.rm = T))
colnames(tempColumn)[2] <- paste("Rolling", summaryFunction, as.character(i), sep = ".")
RawAccelData <- bind_cols(RawAccelData, tempColumn[2])
}
}
但是,我现在需要计算 1 到 10 分钟的滚动时间。我可以通过使用上面的代码并替换为以下行来做到这一点:
for ( i in seq(6000, 60000, by = 6000)) {
但是,这需要数小时才能运行我的数据集,并导致我的 Mac 上的 RStudio(详情如下)挂起!有没有办法a)整理上面的代码或b)使用不同的包/方法来实现更快的结果?
谢谢你。
R version 3.2.3 (2015-12-10)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.10.5 (Yosemite)
locale:
[1] en_AU.UTF-8/en_AU.UTF-8/en_AU.UTF-8/C/en_AU.UTF-8/en_AU.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] zoo_1.7-12 dplyr_0.4.3
loaded via a namespace (and not attached):
[1] lazyeval_0.1.10 magrittr_1.5 R6_2.1.1 assertthat_0.1 parallel_3.2.3 DBI_0.3.1
[7] tools_3.2.3 Rcpp_0.12.2 grid_3.2.3 lattice_0.20-33