9

我有一个熊猫数据框,有 4 行 4 列 - 这是简单的版本:

import pandas as pd
import numpy as np
rows = np.arange(1, 4, 1)
values = np.arange(1, 17).reshape(4,4)
df = pd.DataFrame(values, index=rows, columns=['A', 'B', 'C', 'D'])

我要做的是将其转换为 2 * 8 数据帧,每个数组使用 B、C 和 D alligng - 所以它看起来像这样:

1  2 
1  3
1  4
5  6
5  7
5  8
9  10
9  11
9  12
13 14
13 15
13 16

阅读熊猫文档我试过这个:

df1 = pd.pivot_table(df, rows = ['B', 'C', 'D'], cols = 'A')

但给了我一个我无法识别来源的错误(以

DataError:没有要聚合的数字类型

)

之后我想根据 A 值拆分数据帧,但我认为 .groupby 命令可能会处理它

4

1 回答 1

15

您正在寻找的是melt功能

 pd.melt(df,id_vars=['A']) 

     A variable  value
0    1        B      2
1    5        B      6
2    9        B     10
3   13        B     14
4    1        C      3
5    5        C      7
6    9        C     11
7   13        C     15
8    1        D      4
9    5        D      8
10   9        D     12
11  13        D     16

    

最终的排序根据A然后是必要的

 pd.melt(df,id_vars=['A']).sort('A')  

      A variable  value
 0    1        B      2
 4    1        C      3
 8    1        D      4
 1    5        B      6
 5    5        C      7
 9    5        D      8
 2    9        B     10
 6    9        C     11
 10   9        D     12
 3   13        B     14
 7   13        C     15
 11  13        D     16

注意pd.DataFrame.sort 已弃用,支持pd.DataFrame.sort_values.

于 2013-11-07T17:34:34.840 回答