我对 R 很陌生,所以如果我说错了,请提前道歉:)
我有一个由 395 行和 4973 列组成的数据框,按月排序,许多公司每月出现的次数(范围从 0 到例如 25)。从按月和年分组的每日数据中总结了发生次数。我的数据框 df 看起来像这样(只有几个月和 3 家公司):
Date FirmA FirmB FirmC
01-2015 20 NA 20
02-2015 21 2 1
03-2015 22 3 2
04-2015 24 7 5
05-2015 10 10 10
06-2015 9 20 2
07-2015 13 22 1
08-2015 20 19 1
我现在的任务是通过从 t-3 个月到 t-1 个月(前 3 个月)的三个月滚动窗口来总结每家公司的发生情况。但是,该总和应具有以下条件。它应该在三个月窗口内至少出现 10 次,在 t-1 月至少出现 3 次。只要满足这两个条件,NA 是否在 t-3 和/或 t-2 中都没有关系。
它应该是这样的。
Date FirmA FirmB FirmC
01-2015 NA NA NA
02-2015 20 NA 20
03-2015 41 NA NA
04-2015 63 NA NA
05-2015 67 12 NA
06-2015 56 20 17
07-2015 43 37 NA
08-2015 32 52 NA
我不知道如何解决这个问题,尤其是滚动窗口/总和(可能有滞后)的组合以及关于使用哪些数字和不使用哪些数字的条件。