3

我有一个熊猫数据框df,其中有一列由 组成datetime64,例如

<class 'pandas.core.frame.DataFrame'>
Int64Index: 1471 entries, 0 to 2940
Data columns (total 2 columns):
date    1471  non-null values
id      1471  non-null values
dtypes: datetime64[ns](1), int64(1)

我想df使用一天中的时间作为标准进行子采样(独立于 中的其他信息date)。例如,在伪代码中

df_sub = df[ (HOUR(df.date) > 8) & (HOUR(df.date) < 20) ]

对于某些功能HOUR

我想这个问题可以通过从 到 的初步转换来datetime64解决datetime。这可以更有效地处理吗?

4

1 回答 1

5

找到了一个简单的解决方案。

df['hour'] = df.date.apply(lambda x : x.hour)

df_sub = df[(df.hour > 8) & (df.hour) <20]

编辑:

dt专门引入了一个属性来处理这个问题。查询变为:

df_sub = df[ (df.date.dt.hour > 8) 
              &  (df.date.dt.hour < 20) ]
于 2014-02-07T13:53:08.220 回答