1

我正在编写一个需要 3 个 pandas 系列的函数,其中一个是日期,我需要能够将它变成一个数据框,我可以通过它们重新采样。问题在于,当我简单地执行以下操作时:

>>> data.index = data.time
>>> df = data.resample('M')

我收到以下错误:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/generic.py", line 234, in resample
    return sampler.resample(self)
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/tseries/resample.py", line 100, in resample
    raise TypeError('Only valid with DatetimeIndex or PeriodIndex')
TypeError: Only valid with DatetimeIndex or PeriodIndex

我知道这是因为即使索引类型是 datetime 对象,在进行重采样时,除非它是形式datetime(x,x,x,x,x,x),否则它不会正确读取它。

所以当我使用它时,我的日期数据看起来像这样:2011-12-16 08:09:07,所以我一直在做以下事情:

dates = data.time
date_objects = [datetime.strptime(dates[x], '%Y-%m-%d %H:%M:%S') for x in range(len(dates))]
data.index = date_objects 
df = data.resample('M')

我的问题是我将它用于开源,我不知道输入日期时的格式。

所以我的问题是:如何在不知道字符串格式的情况下将带有日期和时间的字符串转换为日期时间对象?

4

2 回答 2

7

您可以dateutil为此目的使用该库

from dateutil import parser
yourdate = parser.parse(dates[x])
于 2013-05-30T15:52:15.353 回答
3

Pandas 有一个to_datetime用于此目的的函数,当应用于系列时,它将值转换为时间戳而不是日期时间:

data.time = pd.to_datetime(data.time)

df = data.set_index('time')

在哪里:

In [2]: pd.to_datetime('2011-12-16 08:09:07')
Out[2]: datetime.datetime(2011, 12, 16, 8, 9, 7)

In [3]: s = pd.Series(['2011-12-16 08:09:07'])

In [4]: pd.to_datetime(s)
Out[4]:
0   2011-12-16 08:09:07
dtype: datetime64[ns]
于 2013-05-30T16:21:49.370 回答