我有一个不规则的事件(帖子)时间序列xts
,我想计算在滚动的每周窗口(或每两周一次或 3 天等)内发生的事件数。数据如下所示:
postid
2010-08-04 22:28:07 867
2010-08-04 23:31:12 891
2010-08-04 23:58:05 901
2010-08-05 08:35:50 991
2010-08-05 13:28:02 1085
2010-08-05 14:14:47 1114
2010-08-05 14:21:46 1117
2010-08-05 15:46:24 1151
2010-08-05 16:25:29 1174
2010-08-05 23:19:29 1268
2010-08-06 12:15:42 1384
2010-08-06 15:22:06 1403
2010-08-07 10:25:49 1550
2010-08-07 18:58:16 1596
2010-08-07 21:15:44 1608
这应该产生类似的东西
nposts
2010-08-05 00:00:00 10
2010-08-06 00:00:00 9
2010-08-07 00:00:00 5
为期 2 天的窗口。我研究了rollapply
、apply.rolling
fromPerformanceAnalytics
等,它们都假设有规律的时间序列数据。我尝试将所有时间都更改为发布帖子的那一天,并每天使用类似ddply
分组的方式,这让我很接近。但是,用户可能不会每天都发帖,所以时间序列仍然是不规则的。我可以用 0 填补空白,但这可能会使我的数据膨胀很多,而且它已经相当大了。
我应该怎么办?