0

如果我有一个 pandas 数据框 df,以下三种计算列平均值的方法将给出相同的结果:

import numpy as np
df.mean(axis = 0)
df.apply(np.mean)
df.aggregate(np.mean)

但是如果我创建一些组,并以类似的方式使用这些方法呢:

groups = df.groupby(by = 'A')
groups.mean()
groups.apply(np.mean)
groups.aggregate(np.mean)

...在这个例子中 .mean 和 .aggregate 给出相同的结果,但 .apply 没有。使用 .apply 将返回分组列“A”,作为索引和列(当我遇到这个问题时,这不是我所期望或想要的)

这种行为对我来说似乎不一致,还是我错过了这三种方法之间的一些根本区别?

4

0 回答 0