我想使用包含日期时间列和其他一些键的多索引重新采样 DataFrame 。数据框看起来像:
import pandas as pd
from StringIO import StringIO
csv = StringIO("""ID,NAME,DATE,VAR1
1,a,03-JAN-2013,69
1,a,04-JAN-2013,77
1,a,05-JAN-2013,75
2,b,03-JAN-2013,69
2,b,04-JAN-2013,75
2,b,05-JAN-2013,72""")
df = pd.read_csv(csv, index_col=['DATE', 'ID'], parse_dates=['DATE'])
df.columns.name = 'Params'
因为只允许在数据时间索引上重新采样,所以我认为取消堆叠其他索引列会有所帮助。确实如此,但之后我无法再次堆叠它。
print df.unstack('ID').resample('W-THU')
Params VAR1
ID 1 2
DATE
2013-01-03 69 69.0
2013-01-10 76 73.5
但随后再次堆叠“ID”会导致索引错误:
print df.unstack('ID').resample('W-THU').stack('ID')
IndexError: index 0 is out of bounds for axis 0 with size 0
奇怪的是,我可以同时堆叠另一列级别:
print df.unstack('ID').resample('W-THU').stack(0)
和
print df.unstack('ID').resample('W-THU').stack('Params')
如果我重新排序(交换)两个列级别,也会发生索引错误。有谁知道如何克服这个问题?