pandas - pandas：按组成员的频率对分组数据帧进行排序

Question

我有兴趣按每个组的条目数对分组数据框进行排序。据我所知，我可以按组标签排序，也可以不排序。假设我有 10 个条目属于三个组。A组有6名成员，B组有3名成员，C组有1名成员。现在，当我例如执行 grouped.describe() 时，我希望对输出进行排序，以便首先显示具有最多条目的组。

score 2 · Accepted Answer

我会从中提取统计信息describe()，然后您可以简单地使用sort()，因此：

incsv = StringIO("""Group,Value
B,1
B,2
B,3
C,8
A,5
A,10
A,15
A,25
A,35
A,40""")

df = pd.read_csv(incsv)

groups = df.groupby('Group').describe().unstack()

       Value                                                  
       count       mean        std  min    25%  50%   75%  max
Group                                                         
A          6  21.666667  14.023789    5  11.25   20  32.5   40
B          3   2.000000   1.000000    1   1.50    2   2.5    3
C          1   8.000000        NaN    8   8.00    8   8.0    8


dfstats.xs('Value', axis=1).sort('count', ascending=True)

       count       mean        std  min    25%  50%   75%  max
Group                                                         
C          1   8.000000        NaN    8   8.00    8   8.0    8
B          3   2.000000   1.000000    1   1.50    2   2.5    3
A          6  21.666667  14.023789    5  11.25   20  32.5   40

我只是为了说明而颠倒了排序，因为它已经默认排序了，但是你当然可以随意排序。

任何可以按计数排序而不会丢弃或堆叠“价值”级别的人的奖励。:)

pandas - pandas：按组成员的频率对分组数据帧进行排序

1 回答 1

Related

Reference