我有一个日期不完整的 DataFrame,我只需要每个月可用的最后一天的日期/行。我尝试使用 TimeGrouper 并参加.last()
每个组。
import pandas as pd
idx = [pd.datetime(2016,2,1),pd.datetime(2017,1,20),pd.datetime(2017,2,1),pd.datetime(2017,2,27)]
df = pd.DataFrame([1,2,3,4],index=idx)
df
0
2016-02-01 1
2017-01-20 2
2017-02-01 3
2017-02-27 4
期待:
df_eom
0
2016-02-01 1
2017-01-20 2
2017-02-27 4
但是我得到了这个:
df_eom = df.groupby(pd.TimeGrouper(freq='1M')).last()
df_eom
0
2016-02-29 1.0
2016-03-31 NaN
2016-04-30 NaN
2016-05-31 NaN
2016-06-30 NaN
2016-07-31 NaN
2016-08-31 NaN
2016-09-30 NaN
2016-10-31 NaN
2016-11-30 NaN
2016-12-31 NaN
2017-01-31 2.0
2017-02-28 4.0
它不仅创建了不在 df 中的日期,而且还更改了 df 的第一行和最后一行的索引。我使用 TimeGrouper 错了吗?