作为日志系统的一部分,我想解析来自 Cisco 设备的字符串时间戳,其格式如下:
# show clock
16:26:19.990 GMT+1 Wed Sep 11 2013
解析结果应该是一个 UTCdatetime
实例,它将存储在 SQLite 数据库中,因此需要进行时区转换。
使用 justdatetime.strptime
是不够的,因为该%Z
指令仅识别本地时区(即与当前$LANG
或$LC_*
环境相关的时区)。因此,我需要使用pytz包。
因为格式始终相同,所以我可以执行以下操作:
import pytz
from datetime import datetime
s = '16:26:19.990 CEST Wed Sep 11 2013'
tm, tz, dt = s.split(" ", 2)
naive = datetime.strptime("%s %s" % (tm, dt), "%H:%M:%S.%f %a %b %d %Y")
aware = naive.replace(timezone=pytz.timezone(tz))
universal = aware.astimezone(pytz.UTC)
但是,如果不进行一些修改,这将不起作用。的值tz
必须更正为 pytz 可识别的名称。在示例中,pytz.timezone('CEST')
由于UnknownTimezoneError
实际时区为CET
. 问题是没有应用夏令时校正:
>>> from datetime import datetime
>>> from pytz import UTC, timezone
>>> a = datetime.strptime('16:18:57.925 Wed Sep 11 2013', '%H:%M:%S.%f %a %b %d %Y')
>>> b = a.replace(tzinfo=timezone('CET'))
>>> a
datetime.datetime(2013, 9, 11, 16, 18, 57, 925000)
>>> b
datetime.datetime(2013, 9, 11, 16, 18, 57, 925000, tzinfo=<DstTzInfo 'CET' CET+1:00:00 STD>)
>>> b.astimezone(UTC)
datetime.datetime(2013, 9, 11, 15, 18, 57, 925000, tzinfo=<UTC>)
使用normalize
似乎没有帮助:
>>> timezone('CET').normalize(a)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/etanol/virtualenvs/plexus/local/lib/python2.7/site-packages/pytz/tzinfo.py", line 235, in normalize
raise ValueError('Naive time - no tzinfo set')
ValueError: Naive time - no tzinfo set
>>> timezone('CET').normalize(b)
datetime.datetime(2013, 9, 11, 17, 18, 57, 925000, tzinfo=<DstTzInfo 'CET' CEST+2:00:00 DST>)
我真的不知道我错过了什么,但想要的结果是:
datetime.datetime(2013, 9, 11, 14, 18, 57, 925000, tzinfo=<UTC>)
提前致谢。