4

我现在意识到实验性 PanelND 对象将非常适合我的需要,但似乎我无法保存它们:

p4d = pd.Panel4D(np.random.randn(2, 2, 5, 4),
    labels=['Label1','Label2'],
    items=['Item1', 'Item2'],
    major_axis=pd.date_range('1/1/2000', periods=5),
    minor_axis=['A', 'B', 'C', 'D'])
p4d.save('p4d')
...
PicklingError: Can't pickle <class 'pandas.core.panelnd.Panel4D'>: attribute lookup pandas.core.panelnd.Panel4D failed

如果我尝试将其写入 HDFStore,我会得到:

TypeError: cannot properly create the storer for: [_STORER_MAP] [group->/p4d (Group) u'',value-><class 'pandas.core.panelnd.Panel4D'>,table->None,append->False,kwargs->{}]

除了保存单个 DataFrame 并将它们拼接在一起之外,我怎样才能保留更高维度的对象?

编辑:我看到这store.append()适用于 Panel4D 但save()不适store.append()用于示例 Panel5D。我真的在追求高于4D,所以问题仍然存在。

编辑:更多信息:

我正在尝试在跨维度的嵌套循环中创建一个任意维度的面板,然后能够再次任意切片该数据,以便我可以处理它(整理、绘图、优化)

在(粗略)代码中:

for a in range(1,10):
    panel4ddict = {}
    for b in range(101, 150):
    paneldict = {}
        for c in range(500, 501):
            df = MakeDataFrame(a, b, c) # returns processed df
            paneldict[c] = df
        p3d = Panel(paneldict)
        panel4ddict[b] = p3d
    p4d = Panel4D(panel4ddict)
    panel5ddict[a] = p4d
panel5d = Panel5D(panel5ddict)

sliced = panel5d[:,3,5:6]
# and then do some plotting of my sliced DF
4

1 回答 1

1

这是一种存储 Panel5D 的方法。本质上,您将每个 Panel4D 作为单独的组存储在存储中,然后在回读时重建。

请注意,您最好将其存储为具有多级(3 个或更多)的 DataFrame,它实际上包含与 Panel5D 相同的信息,但长期展开。

 In [1]: from pandas.core import panelnd, panel4d
        from pandas.utils import testing as tm 

In [2]: Panel5D = panelnd.create_nd_panel_factory(
   ...:     klass_name='Panel5D',
   ...:     axis_orders=['cool', 'labels', 'items', 'major_axis',
   ...:                  'minor_axis'],
   ...:     axis_slices={'labels': 'labels', 'items': 'items',
   ...:                  'major_axis': 'major_axis',
   ...:                  'minor_axis': 'minor_axis'},
   ...:     slicer=panel4d.Panel4D,
   ...:     axis_aliases={'major': 'major_axis', 'minor': 'minor_axis'},
   ...:     stat_axis=2)

In [4]: p4d = panel4d.Panel4D(dict(L1=tm.makePanel(), L2=tm.makePanel()))

In [5]: p5d = Panel5D(dict(C1 = p4d, C2 = p4d+1))

In [6]: p5d
Out[6]: 
<class 'pandas.core.panelnd.Panel5D'>
Dimensions: 2 (cool) x 2 (labels) x 3 (items) x 30 (major_axis) x 4 (minor_axis)
Cool axis: C1 to C2
Labels axis: L1 to L2
Items axis: ItemA to ItemC
Major_axis axis: 2000-01-03 00:00:00 to 2000-02-11 00:00:00
Minor_axis axis: A to D

In [7]: store = pd.HDFStore('test.h5',mode='w')

In [9]: for x in p5d.cool:
    store.append(x,p5d[x])
   ...:     

In [10]: store
Out[10]: 
<class 'pandas.io.pytables.HDFStore'>
File path: test.h5
/C1            wide_table   (typ->appendable,nrows->360,ncols->2,indexers->[items,major_axis,minor_axis])
/C2            wide_table   (typ->appendable,nrows->360,ncols->2,indexers->[items,major_axis,minor_axis])

In [11]: store.close()
于 2013-06-23T21:42:40.643 回答