我有以下数据框:
df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T
df.columns = ['col1','col2','col3','col4']
当我分组时,我得到:
df.groupby(['col4','col2']).sum()
col1 col3
col4 col2
1 A 1.1 1.1
D 5.5 14.2
2 B 6.0 6.4
3 A 4.8 8.4
C 3.4 4.5
4 B 2.5 3.3
5 B 5.2 8.6
6 B 3.4 4.3
但是,我想要的是每个一级索引都具有相同的二级索引。这是不可能的,因为缺少数据。我想要实现的是:
col1 col3
col4 col2
1 A 1.1 1.1
B 0 0
C 0 0
D 5.5 14.2
2 A 0 0
B 6.0 6.4
C 0 0
D 0 0
3 A 4.8 8.4
B 0 0
C 3.4 4.5
D 0 0
4 A 0 0
B 2.5 3.3
C 0 0
D 0 0
5 A 0 0
B 5.2 8.6
C 0 0
D 0 0
6 A 0 0
B 3.4 4.3
C 0 0
D 0 0