5

我使用熊猫数据框聚合了数据。下面是显示的一些实际数据以及我如何汇总它。

fdf.groupby(['row',col'])['percent'].sum()

http://pastebin.com/R8XWpgtU

我想做的是创建一个二维numpy数组(行=行,列=列)。有什么巧妙的方法可以做到这一点吗?

我做类似事情的另一种方法是创建一个数据透视表

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

在这种情况下,我想将此数据透视表转换为 2d numpy 数组。有没有办法让我索引到这个表的每个单元格。如果是这样,那么我可能会对桌子本身没问题。

4

1 回答 1

6

尝试:

result = fdf.groupby(['row',col'])['percent'].sum()
result.unstack('col').values

交替:

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values
于 2012-04-18T21:50:13.353 回答