3

我有一个要转换为多索引数据框的嵌套字典对象,我该如何实现它。

例如

t['a'] = dict()
t['b'] = dict()
t['a']['1'] = pd.DataFrame([ [1.0,2.0],[3.0,4.0] ])
t['a']['2'] = pd.DataFrame([ [5.0,6.0],[7.0,8.0] ])
t['b']['1'] = pd.DataFrame([ [1.0,2.0],[3.0,4.0] ])
t['b']['2'] = pd.DataFrame([ [5.0,6.0],[7.0,8.0] ])

所以我想转换为一个带有索引的数据框

a
   1        0      1  
      0    1.0    2.0 
      1    3.0    4.0
   2  
      0    5.0    6.0
      1    7.0    8.0
b
   1
      0    1.0    2.0
      1    3.0    4.0
   2
      0    5.0    6.0
      1    7.0    8.0

我想我可以使用MultiIndex(levels=[ ['a','b'], [1,2] ]),但我不知道如何构建标签。我也不知道如何将 dict 值作为数据数组传递。

4

2 回答 2

4

我发现从元组列表中获取 MultiIndex 是最简单的方法,如此处所述

使用您的示例,我们有一个嵌套字典,例如

In [25]: t
Out[25]: 
{'a': {'1':    0  1
0  1  2
1  3  4, '2':    0  1
0  5  6
1  7  8},
 'b': {'1':    0  1
0  1  2
1  3  4, '2':    0  1
0  5  6
1  7  8}}

如果你想让你的头有点疼,你可以使用这个列表理解:

In [50]: tuples = [(x, y, z) for x in t for y in t[x] for z in t[x][y]]

In [51]: tuples
Out[51]: 
[('a', '1', 0),
 ('a', '1', 1),
 ('a', '2', 0),
 ('a', '2', 1),
 ('b', '1', 0),
 ('b', '1', 1),
 ('b', '2', 0),
 ('b', '2', 1)]

然后idx = pd.MultiIndex.from_tuples(tuples)将作为您的索引。

解压这些值需要做更多的工作。

编辑:你真的应该去杰夫的回答,但为了完整性:

In [114]: df = pd.concat([x for z in t for x in t[z].values()])

In [115]: df.index = idx

In [118]: df
Out[118]: 
       0  1
a 1 0  1  2
    1  3  4
  2 0  5  6
    1  7  8
b 1 0  1  2
    1  3  4
  2 0  5  6
    1  7  8
于 2013-07-11T20:45:58.053 回答
1

一个框架的字典形成一个面板,to_frame转换为一个 2 级索引,你想要一个额外的级别,当传递一个 dict 时 concat 形成

从理论上讲,如果您需要更多级别,您可以执行递归归约之类的操作,但这会炸毁大脑。要获得准确的输出,您可以执行sortlevel.

In [36]: concat( dict([ (k,Panel(v).to_frame()) for k,v in t.items() ]) , names= ['level'])
Out[36]: 
                   1  2
level major minor      
a     0     0      1  5
            1      2  6
      1     0      3  7
            1      4  8
b     0     0      1  5
            1      2  6
      1     0      3  7
            1      4  8
于 2013-07-11T20:27:36.277 回答