我正在尝试根据休息日计算 Python 中的移动总和,但是我的数据框中没有列出每个日期。在下面的示例中,cum sum 应说明数据框中缺少 2021-01-03 日期这一事实
import pandas as pd
df = pd.DataFrame({'date':['2021-01-01', '2021-01-02', '2021-01-04', '2021-01-05'],
'value':[1, 1, 1, 1]})
df_correct = pd.DataFrame({'date':['2021-01-01', '2021-01-02', '2021-01-04', '2021-01-05'],
'value':[1, 1, 1, 1],
'2_day_cum_sum':[1, 2, 1, 2]})
print(df_correct)
我知道如何使用 pandas 的滚动函数计算滚动总和,但我不知道如何解释丢失的日期。我目前的愿景是创建一个包含日期和其他变量的每个组合的数据框(不在这个基本示例中),然后将活动数据集合并到该数据框,这样我就可以有效地使用 pandas 的滚动功能。但是,我觉得存在更好的方法。有什么想法吗?