我有一系列,news
我想news
通过滚动窗口(例如,3 天)对列进行分组,以进行进一步的文本分析。
注意:索引可能不是连续的天数(可能有些天没有条目)。
熊猫数据框如下所示:
date news
0 2017-01-03 'textA'
1 2017-01-03 'textB'
2 2017-01-04 'textC'
3 2017-01-05 'textD'
4 2017-01-05 'textE'
5 2017-01-05 'textF'
6 2017-01-06 'textG'
7 2017-01-06 'textH'
8 2017-01-07 'textI'
我想使用 3 天滚动窗口迭代所有新闻。像 data.groupby('date', rolling = 3).apply(something) 之类的东西(我知道没有这样的语法,仅用于说明目的)
第一次应用操作将应用于以下数据(从 2017-01-03 到 2017-01-05)。
2017-01-03 'textA'
2017-01-03 'textB'
2017-01-04 'textC'
2017-01-05 'textD'
2017-01-05 'textE'
2017-01-05 'textF'
相应地,对这个的第二个apply操作:(从2017-01-04到2017-01-06)
2017-01-04 'textC'
2017-01-05 'textD'
2017-01-05 'textE'
2017-01-05 'textF'
2017-01-06 'textG'
2017-01-06 'textH'
我知道我可以手动找到索引并进行切片。但是,如果有使用 Python 和 Pandas 功能的更方便的方法来执行此操作,我想要。