2

我试图找出一种基于数据向量计算滚动总和值的方法。下面是一个示例数据框和我试图计算的答案,但无法找出正确的解决方案。本质上,我试图将每个 x 列值乘以 y 向量并根据周期求和。

period= c(1,2,3)
x=c(1,1,1)
y= c(2,3,4)

df=data.frame(period,x,y)

This is how I solved the answer.

2+0+0
3+2+0
4+3+2
0+4+3
0+0+4

answer= c(2,5,9,7,4)

我查看了 slam 包以及 crossprod 功能,但无济于事。

提前致谢!

4

3 回答 3

2

我们可能会使用

c(cumsum(df$y), rev(cumsum(rev(df$y)))[-1])
# [1] 2 5 9 7 4

cumsum(df$y)给出从一端开始的累积和,然后从另一端开始rev(cumsum(rev(df$y))给出,并且我们有[-1]完全和重合:

cumsum(df$y)
# [1] 2 5 9
rev(cumsum(rev(df$y)))
# [1] 9 7 4
于 2019-01-11T17:48:14.493 回答
2

如果目标是计算 3 个值的滚动总和,以便隐式添加 0 以确保输出具有 5 个元素,即使输入有 3,请尝试以下操作:

1) rollapply根据是否使用右对齐、居中对齐或左对齐以及是否使用,乘以x和插入 0 。 是 的默认值并且是 的默认值。ypartial=align="center"rollapplyalign = "right"rollapplyr

library(zoo)

rollapply(c(0, x*y, 0), 3, sum, partial = TRUE)
## [1] 2 5 9 7 4

rollapplyr(c(x*y, 0, 0), 3, sum, partial = TRUE)
## [1] 2 5 9 7 4

rollapplyr(c(0, 0, x*y), 3, sum, align = "left", partial = TRUE)
## [1] 2 5 9 7 4

rollapply(c(0, 0, x*y, 0, 0), 3, sum)
## [1] 2 5 9 7 4

rollsum(c(0, 0, x*y, 0, 0), 3) #  this solution has the lowest character count
## [1] 2 5 9 7 4

2) 基础 R可以使用以下方式编写基础解决方案embed

rowSums(embed(c(0, 0, x*y, 0, 0), 3))
## [1] 2 5 9 7 4

2a)或取累积和并减去累积和 3:

cumsum(c(x*y,0,0)) - cumsum(c(0, 0, 0, (x*y)[-3]))
## [1] 2 5 9 7 4

2b)如果想法是要进行循环计算,那么:

c(filter(c(0, x*y, 0), c(1,1,1), circular = TRUE))
## [1] 2 5 9 7 4
于 2019-01-11T19:01:20.777 回答
0

如果有人想按组进行类似的计算,下面的代码应该可以工作。

df_nest<-df%>% group_by(variable)%>%nest()

df_nest%>%
  mutate(NewColumn = map(data, ~rollapplyr(c(.$x*.$y, 0, 0), 3, sum, partial = TRUE)))%>%
  unnest()
于 2019-01-12T03:59:56.003 回答