我有一个包含 2 组的大数据框:分数和日期。熊猫工具是否有一种简单的可能性,可以用之前值的平均值(替代 ewma 等)来填补空白和缺失的分数。
首先,我通过分组覆盖分数,然后将修改后的分组df堆叠在一起。
dfg = df.groupby(['g1','g2'])
for name , group in dfg:
print group
break
ix g1 g2 score day
4 19 24 4.150513 2014-02-12
5 19 24 6.986235 2014-02-13
6 19 24 9.634231 2014-02-14
7 19 24 1.818548 2014-02-15
8 19 24 1.699897 2014-03-02
9 19 24 2.128781 2014-03-25
10 19 24 1.720297 2014-03-26
14 19 24 2.079877 2014-03-30