我有一个大型数据集,其中包含来自不同时区的时间戳,可以追溯到一年前。每个条目都包含一个时间戳和当前从 UTC 中删除时间戳的时区的秒数。因此,例如,来自美国东部时区的时间戳将附加 14400。如果不是因为来自非 DST 时间(即年初)的时间戳也附有 14400,表示东部时区,这可能很容易处理。
考虑到 DST,我有什么特别有效的方法可以将这堆数据转换为 Python 中的纯 UTC 时间戳吗?
您可以像这样使用dateutil
模块和pytz
模块:
import dateutil.parse
import pytz
parsed_as_utc = dateutil.parser.parse(timestamp).astimezone(pytz.utc)