8

我有以下数据框:

import pandas as pd
index = pd.date_range('2013-1-1',periods=10,freq='15Min')
data = pd.DataFrame(data=[1,2,3,4,5,6,7,8,9,0], columns=['value'], index=index)

如何根据索引值生成掩码?我知道我可以做类似的事情:

data['value'] > 3
Out[40]: 
2013-01-01 00:00:00    False
2013-01-01 00:15:00    False
2013-01-01 00:30:00    False
2013-01-01 00:45:00     True
2013-01-01 01:00:00     True
2013-01-01 01:15:00     True
2013-01-01 01:30:00     True
2013-01-01 01:45:00     True
2013-01-01 02:00:00     True
2013-01-01 02:15:00    False
Freq: 15T, Name: value, dtype: bool

我想生成一个掩码,只考虑索引在一定范围内的一些行。我正在考虑做一些类似data['index'].time() > datetime.time(1,15)生成面具的事情。除了当然data['index']失败,因为索引不是列的名称。如何引用掩码中一行的索引值?

4

2 回答 2

15

您可以使用以下方法进行遮罩indexer_between_time

In [11]: data.index.indexer_between_time(start='01:15', end='02:00')
Out[11]: array([5, 6, 7, 8])

In [12]: data.iloc[data.index.indexer_between_time(start='1:15', end='02:00')]
Out[12]:
                     value
2013-01-01 01:15:00      6
2013-01-01 01:30:00      7
2013-01-01 01:45:00      8
2013-01-01 02:00:00      9

如您所见,您通过属性访问索引.index

注意:indexer_between_time默认情况下,两者include_start都是include_endTrue,它还提供了一个tz参数来将时间与不同的时区进行比较。

于 2013-07-09T23:23:11.240 回答
5

'start' 和 'stop' 关键字已弃用。使用 pandas >17.1;我不得不改用以下语法:

data.iloc[data.index.indexer_between_time('1:15', '02:00')]
Out[90]: 
                     value
2013-01-01 01:15:00      6
2013-01-01 01:30:00      7
2013-01-01 01:45:00      8
2013-01-01 02:00:00      9
于 2016-02-11T19:08:35.647 回答