1

从文档中可以得到这样.aggregatedataframe.groupby对象:

df = pd.DataFrame([[1, 2, 3],
                   [-4, 5, 6],
                   [7, 8, 9],
                   [np.nan, np.nan, np.nan]],
                  columns=['A', 'B', 'C'])

然后aggregate像这样:

my_agg = {'A' : ['mean', 'min'], 'B' : ['mean', 'max']}
df.agg(my_agg)

那很好,但我想在这里取abs(np.mean)of 专栏A。是否可以将其定义为 的一部分my_agg?什么是 dask 的解决方案?

4

1 回答 1

3

是的,我们可以通过lambda

my_agg = {'A' : ['mean', 'min', lambda x : abs(x.mean())], 'B' : ['mean', 'max']}
df.agg(my_agg)
Out[194]: 
                 A    B
<lambda>  1.333333  NaN
max            NaN  8.0
mean      1.333333  5.0
min      -4.000000  NaN
于 2020-08-24T00:25:23.830 回答