您可以使用该函数tz_localize
使 Timestamp 或 DateTimeIndex 时区感知,但您如何做相反的事情:如何将时区感知 Timestamp 转换为幼稚时间戳,同时保留其时区?
一个例子:
In [82]: t = pd.date_range(start="2013-05-18 12:00:00", periods=10, freq='s', tz="Europe/Brussels")
In [83]: t
Out[83]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 12:00:00, ..., 2013-05-18 12:00:09]
Length: 10, Freq: S, Timezone: Europe/Brussels
我可以通过将时区设置为无来删除时区,但随后结果将转换为 UTC(12 点变为 10):
In [86]: t.tz = None
In [87]: t
Out[87]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 10:00:00, ..., 2013-05-18 10:00:09]
Length: 10, Freq: S, Timezone: None
有没有另一种方法可以将 DateTimeIndex 转换为天真时区,但同时保留它设置的时区?
关于我提出这个问题的原因的一些背景信息:我想使用时区天真的时间序列(以避免时区的额外麻烦,并且在我正在处理的情况下我不需要它们)。
但由于某种原因,我必须在我的本地时区(欧洲/布鲁塞尔)处理一个时区感知时间序列。由于我的所有其他数据都是时区幼稚的(但以我的本地时区表示),我想将此时间序列转换为幼稚以进一步使用它,但它也必须以我的本地时区表示(所以只需删除时区信息,无需将用户可见时间转换为 UTC)。
我知道时间实际上是内部存储为 UTC 并且仅在您表示它时转换为另一个时区,因此当我想“去本地化”它时必须进行某种转换。例如,使用 python datetime 模块,您可以像这样“删除”时区:
In [119]: d = pd.Timestamp("2013-05-18 12:00:00", tz="Europe/Brussels")
In [120]: d
Out[120]: <Timestamp: 2013-05-18 12:00:00+0200 CEST, tz=Europe/Brussels>
In [121]: d.replace(tzinfo=None)
Out[121]: <Timestamp: 2013-05-18 12:00:00>
因此,基于此,我可以执行以下操作,但我认为在处理更大的时间序列时这不会很有效:
In [124]: t
Out[124]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 12:00:00, ..., 2013-05-18 12:00:09]
Length: 10, Freq: S, Timezone: Europe/Brussels
In [125]: pd.DatetimeIndex([i.replace(tzinfo=None) for i in t])
Out[125]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 12:00:00, ..., 2013-05-18 12:00:09]
Length: 10, Freq: None, Timezone: None