407

如何将字符串的 DataFrame 列(dd/mm/yyyy格式)转换为日期时间?

4

4 回答 4

619

最简单的方法是使用to_datetime

df['col'] = pd.to_datetime(df['col'])

它还dayfirst为欧洲时代提供了一个论据(但要注意这并不严格)。

这是在行动:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

您可以传递特定格式

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]
于 2013-06-16T15:18:23.183 回答
54

如果您的日期列是格式为“2017-01-01”的字符串,您可以使用 pandas astype 将其转换为日期时间。

df['date'] = df['date'].astype('datetime64[ns]')

或使用 datetime64[D] 如果您想要 Day 精度而不是纳秒

print(type(df_launath['date'].iloc[0]))

产量

<class 'pandas._libs.tslib.Timestamp'> 与使用 pandas.to_datetime 时相同

您可以尝试使用其他格式,然后是 '%Y-%m-%d',但至少这是可行的。

于 2017-06-26T14:35:27.517 回答
45

如果要指定棘手的格式,可以使用以下内容:

df['date_col'] =  pd.to_datetime(df['date_col'], format='%d/%m/%Y')

更多细节在format这里:

于 2018-05-02T08:14:16.923 回答
16

如果您的日期中有多种格式,请不要忘记设置infer_datetime_format=True以使生活更轻松。

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

资料来源:pd.to_datetime

或者如果您想要自定义方法:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
于 2019-07-28T01:04:52.140 回答