0

我有一个这样的数据表:

   a group
1: 1     a
2: 2     a
3: 3     a
4: 4     a
5: 5     a
6: 6     a

可以从以下代码创建示例:

structure(list(a = 1:100, group = c("a", "a", "a", "a", "a", 
"a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", 
"a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", 
"a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", "a", 
"a", "a", "a", "a", "a", "a", "b", "b", "b", "b", "b", "b", "b", 
"b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", 
"b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", 
"b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", "b", 
"b", "b", "b", "b")), .Names = c("a", "group"), row.names = c(NA, 
-100L), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x0000000004790788>)

对于每组中的每一行,我想:

  1. 在列中取值a
  2. 将它除以列中a滞后 2 的值并减去 1
  3. 将它除以列中a滞后 4 的值并减去 1
  4. 将其除以滞后 6 列中的值a并减去 1
  5. 对步骤 2-4 的结果求和并将其返回到新列中

所以对于第 1-6 行,我会有NA, 然后7/5 + 7/3 + 7/1 - 3, 8/6 + 8/4 + 8/2 - 3, 9/7 + 9/5 + 9/3 - 3,10/8 + 10/6 + 10/4 - 3

因此,根据第一个块中报告的表,我想得到一个新列,比如metric_1,它将在第 10 行具有值2.416667

请注意,列中的值a实际上并不对应于行号,而是一些测量值。

最终输出将如下所示:

     a group metric_1
 1:  1     a       NA
 2:  2     a       NA
 3:  3     a       NA
 4:  4     a       NA
 5:  5     a       NA
 6:  6     a       NA
 7:  7     a 7.733333
 8:  8     a 4.333333
 9:  9     a 3.085714
10: 10     a 2.416667

如果我需要对向量中的一些值求和,我已经尝试了一些版本,Reduce它们的工作原理就像一个冠军,但我无法调整它以使我能够像这样进行除法。

4

2 回答 2

0

我不确定这是否正是您正在寻找的,但也许它会有所帮助:

library(dplyr)

the_data %>% group_by(group) %>% 
mutate(metric_1 = (a/lag(a, 2)-1)+( a/lag(a,4)-1) + (a/lag(a, 6) - 1 )) %>%
ungroup()
于 2017-11-10T20:19:35.710 回答
0

找到了一种可能的解决方案:

dt[,
     list(a, Reduce(`+`, lapply(shift(a, seq(2, 6, by = 2)),
       function(x) a/x - 1))), 
     by = "group"]

但它比较慢。

于 2017-11-10T22:38:56.510 回答