2

我有一系列,news我想news通过滚动窗口(例如,3 天)对列进行分组,以进行进一步的文本分析。

注意:索引可能不是连续的天数(可能有些天没有条目)。

熊猫数据框如下所示:

        date      news
0    2017-01-03  'textA'
1    2017-01-03  'textB'
2    2017-01-04  'textC'
3    2017-01-05  'textD'
4    2017-01-05  'textE'
5    2017-01-05  'textF'
6    2017-01-06  'textG'
7    2017-01-06  'textH'
8    2017-01-07  'textI'

我想使用 3 天滚动窗口迭代所有新闻。像 data.groupby('date', rolling = 3).apply(something) 之类的东西(我知道没有这样的语法,仅用于说明目的)

第一次应用操作将应用于以下数据(从 2017-01-03 到 2017-01-05)。

2017-01-03  'textA'
2017-01-03  'textB'
2017-01-04  'textC'
2017-01-05  'textD'
2017-01-05  'textE'
2017-01-05  'textF'

相应地,对这个的第二个apply操作:(从2017-01-04到2017-01-06)

2017-01-04  'textC'
2017-01-05  'textD'
2017-01-05  'textE'
2017-01-05  'textF'
2017-01-06  'textG'
2017-01-06  'textH'

我知道我可以手动找到索引并进行切片。但是,如果有使用 Python 和 Pandas 功能的更方便的方法来执行此操作,我想要。

4

0 回答 0