22

继我之前的问题Python time to age之后,我现在遇到了一个关于时区的问题,事实证明它并不总是“+0200”。所以当 strptime 试图解析它时,它会抛出一个异常。

我想过用 [:-6] 或其他什么来切断 +0200,但是有没有真正的方法可以用 strptime 做到这一点?

如果重要的话,我正在使用 Python 2.5.2。

>>> from datetime import datetime
>>> fmt = "%a, %d %b %Y %H:%M:%S +0200"
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200", fmt)
datetime.datetime(2008, 7, 22, 8, 17, 41)
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0300", fmt)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.5/_strptime.py", line 330, in strptime
    (data_string, format))
ValueError: time data did not match format:  data=Tue, 22 Jul 2008 08:17:41 +0300  fmt=%a, %d %b %Y %H:%M:%S +0200
4

5 回答 5

40

有没有真正的方法可以用 strptime 做到这一点?

不,但由于您的格式似乎是 RFC822 系列日期,您可以使用电子邮件库更轻松地阅读它:

>>> import email.utils
>>> email.utils.parsedate_tz('Tue, 22 Jul 2008 08:17:41 +0200')
(2008, 7, 22, 8, 17, 41, 0, 1, 0, 7200)

(7200 = 与 UTC 的时区偏移,以秒为单位)

于 2009-02-09T02:22:49.683 回答
28

2.6 版中的新功能。

对于一个天真的对象,%z 和 %Z 格式代码被空字符串替换。

看起来这仅在> = 2.6中实现,我认为您必须手动解析它。

除了删除时区数据,我看不到其他解决方案:

from datetime import timedelta,datetime
try:
    offset = int("Tue, 22 Jul 2008 08:17:41 +0300"[-5:])
except:
    print "Error"

delta = timedelta(hours = offset / 100)

fmt = "%a, %d %b %Y %H:%M:%S"
time = datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200"[:-6], fmt)
time -= delta
于 2009-02-08T21:30:13.290 回答
18

您可以使用dateutil非常有用的库:

from datetime import datetime
from dateutil.parser import parse

dt = parse("Tue, 22 Jul 2008 08:17:41 +0200")
## datetime.datetime(2008, 7, 22, 8, 17, 41, tzinfo=tzoffset(None, 7200)) <- dt

print dt
2008-07-22 08:17:41+02:00
于 2009-03-12T14:48:06.807 回答
1

据我所知,strptime()不识别数字时区代码。如果您知道字符串总是以该形式的时区规范结束(+ 或 - 后跟 4 位数字),那么将其剪掉并手动解析似乎是一件非常合理的事情。

于 2009-02-08T21:25:06.483 回答
0

似乎 %Z 对应于时区名称,而不是偏移量。

例如,给定:

>>> format = '%a, %d %b %Y %H:%M:%S %Z'

我可以解析:

>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 GMT', format)
datetime.datetime(2008, 7, 22, 8, 17, 41)

虽然它似乎对时区没有任何作用,只是观察它存在并且有效:

>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 NZDT', format)
datetime.datetime(2008, 7, 22, 8, 17, 41)

我想如果您愿意,您可以找到偏移量到名称的映射,转换您的输入,然后解析它。不过,截断您的输入可能更简单。

于 2009-02-08T23:23:29.240 回答