16

数据框我有:

            A   B   C 
2012-01-01  1   2   3 
2012-01-05  4   5   6 
2012-01-10  7   8   9 
2012-01-15  10  11  12 

我现在使用的是:

date_after = dt.datetime( 2012, 1, 7 )
frame.ix[date_after:].ix[0:1]
Out[1]: 
            A  B  C
2012-01-10  7  8  9

有没有更好的方法来做到这一点?我不喜欢我必须指定 .ix[0:1] 而不是 .ix[0],但如果我不指定输出更改为 TimeSeries 而不是 DataFrame 中的单行。我发现在原始 DataFrame 之上使用旋转的 TimeSeries 更难。

没有.ix[0:1]

frame.ix[date_after:].ix[0]
Out[1]: 
A    7
B    8
C    9
Name: 2012-01-10 00:00:00

谢谢,

约翰

4

3 回答 3

31

您可能想直接做索引:

i = frame.index.searchsorted(date)
frame.ix[frame.index[i]]

有点冗长,但你可以把它放在一个函数中。和你得到的一样好 ( O(log n))

于 2012-03-29T03:54:52.137 回答
31

忍不住回答了这个问题,尽管这个问题在 2012 年由 Wes 本人提出并回答,并在 2015 年由 ajsp 再次提出。是的,除了“截断”之外,您还可以使用带有“回填”选项的get_loc来获取特定日期之后的最近日期。顺便说一句,如果您想在特定日期之前找到最近的日期,请使用“填充”。如果您只想在附近,请使用“最近”。

df.iloc[df.index.get_loc(datetime.datetime(2016,2,2),method='backfill')]
于 2016-10-22T04:47:11.830 回答
8

忍不住回答这个问题,尽管这个问题是在 2012 年由韦斯本人提出并回答的。是的,只需使用截断。

df.truncate(before='2012-01-07')
于 2015-12-17T04:46:05.597 回答