我在熊猫 0.13.1 上。假设我需要使用时区通过分层索引中的两个时间戳来索引数据,这种方法可以正常工作:
import pandas as pd
dti1 = pd.DatetimeIndex(start=pd.Timestamp('20000101'), end=pd.Timestamp('20000102'), freq='D', tz='EST5EDT')
dti2 = pd.DatetimeIndex(start=pd.Timestamp('20000102'), end=pd.Timestamp('20000103'), freq='D', tz='EST5EDT')
pd.MultiIndex.from_arrays([list(dti1), list(dti2)])
我得到:
MultiIndex(levels=[[2000-01-01 00:00:00-05:00, 2000-01-02 00:00:00-05:00], [2000-01-02 00:00:00-05:00, 2000-01-03 00:00:00-05:00]],
labels=[[0, 1], [0, 1]])
尽管
pd.MultiIndex.from_arrays([dti1, dti2])
返回时区朴素索引:
MultiIndex(levels=[[2000-01-01 05:00:00, 2000-01-02 05:00:00], [2000-01-02 05:00:00, 2000-01-03 05:00:00]],
labels=[[0, 1], [0, 1]])
期望两者返回相同的时区。这是预期的吗?