我看到 Pandas 还不允许重复的时间序列索引(https://github.com/pydata/pandas/issues/643),但很快就会添加。我想知道是否有一种好方法可以通过多索引标签/列将滚动窗口均值应用于具有重复时间的数据集
基本上,我有一个由纪元时间、分层标签(tag1、tag2)和所用时间组成的无序事件的 csv。一个小样本:
epochTimeMS,event,tag,timeTakenMS
1331782842801,event1,tag1,16
1331782841535,event1,tag2,1278
1331782842801,event1,tag1,17
1331782842381,event2,tag1,436
我想要做的是通过事件和事件+标签构建和绘制具有不同 ms 窗口的滚动方式。这似乎应该在 Pandas 中完成,但不确定我是否需要先等到重复的时间序列索引。现在有什么想法可以解决这个问题吗?