我正在使用 groupby 和 sum 快速聚合两个数据集
一个包含:
sequence shares
1 100
2 200
3 50
1 200
B 其中包含:
sequence shares
1 100
2 200
2 50
3 50
我正在使用A=A.groupby(['sequence']).sum()
andB=B.groupby(['sequence']).sum()
对每个序列的份额求和。然后,我想再次连接这些集合,并对序列中的份额求和。但是,我尝试使用C = concat([A,B])
,现在发现我只有列共享作为索引,不能按顺序分组。C.group(['sequence']).sum()
给我一个错误 KeyError: u'no item named sequence'。
我想得到的是C:
sequence shares
1 400
2 450
3 100
谁能解释这里发生了什么?我可以在 groupby().sum() 之前进行连接,但我真的想在连接之前将这些数据集缩小到更小的大小。