4

我有一个带有日期时间索引的熊猫数据框。为简单起见,假设我的数据从 2016 年 9 月 1 日到 2019 年 9 月 1 日,每一行对应一天。

无论年份如何,我都想选择日期在 11 月 15 日至 3 月 15 日之间的所有行。对于我的示例数据集,这将是:2016 年 11 月 15 日 - 2017 年 3 月 15 日,2017 年 11 月 15 日 - 2018 年 3 月 15 日,以及 2018 年 11 月 15 日 - 2019 年 3 月 15 日。

在 2 个日期时间(当年份已知时)之间选择行非常简单,但是当我们不关心年份时,我想不出一种简单的方法来做到这一点。理想情况下,我想将其设置为可以轻松更改范围的开始和结束日期(而不是从 11 月 15 日开始,我可以从 11 月 21 日开始,等等)。

提前感谢您的帮助!

4

1 回答 1

5

这是我要做的:

df = pd.DataFrame({'date': pd.date_range('2016-09-01','2019-09-01', freq='D')})

# dummy variable for filter
s = df['date'].dt.month * 100 + df['date'].dt.day

# filter out the day between 3/16 and 11/14:
df[~s.between(316,1114)].head()

输出:

         date
75 2016-11-15
76 2016-11-16
77 2016-11-17
78 2016-11-18
79 2016-11-19
于 2019-09-26T14:00:48.070 回答