我想对一些数据执行聚合,但是一旦完成,将聚合链接回构成聚合的行。
df = pd.DataFrame({"vehicle": ['car','bus','bus' ,'car','bus'],
"colour" : ['red','red','blue','red','blue'],
"weight" : [ 1, 14, 10, 2, 12]
})
grouped = df.groupby(["vehicle", "colour"], as_index=False)
print grouped.agg({"weight":"sum"})
vehicle colour weight
0 bus blue 22
1 bus red 14
2 car red 3
假设我要显示聚合,我可以遍历上述聚合数据。但是,我也希望能够确定/显示构成任何给定聚合的行。即我需要能够有效地确定红色汽车聚合由原始数据集中的第 0 行和第 3 行组成
最终,我想将这种关系保留到一个文件中——但我不确定这是否可以在一个组合数据集中完成,或者我是否需要两个单独的数据集——通过一种将任何给定聚合链接回原始数据中的行
我的主要问题是 - 我如何确定红色汽车 = 3,由原始数据集中的第 0 行和第 3 行组成。
非常感谢您的帮助,马库斯