我有兴趣按每个组的条目数对分组数据框进行排序。据我所知,我可以按组标签排序,也可以不排序。假设我有 10 个条目属于三个组。A组有6名成员,B组有3名成员,C组有1名成员。现在,当我例如执行 grouped.describe() 时,我希望对输出进行排序,以便首先显示具有最多条目的组。
问问题
1740 次
1 回答
2
我会从 中提取统计信息describe()
,然后您可以简单地使用sort()
,因此:
incsv = StringIO("""Group,Value
B,1
B,2
B,3
C,8
A,5
A,10
A,15
A,25
A,35
A,40""")
df = pd.read_csv(incsv)
groups = df.groupby('Group').describe().unstack()
Value
count mean std min 25% 50% 75% max
Group
A 6 21.666667 14.023789 5 11.25 20 32.5 40
B 3 2.000000 1.000000 1 1.50 2 2.5 3
C 1 8.000000 NaN 8 8.00 8 8.0 8
dfstats.xs('Value', axis=1).sort('count', ascending=True)
count mean std min 25% 50% 75% max
Group
C 1 8.000000 NaN 8 8.00 8 8.0 8
B 3 2.000000 1.000000 1 1.50 2 2.5 3
A 6 21.666667 14.023789 5 11.25 20 32.5 40
我只是为了说明而颠倒了排序,因为它已经默认排序了,但是你当然可以随意排序。
任何可以按计数排序而不会丢弃或堆叠“价值”级别的人的奖励。:)
于 2013-06-26T15:05:48.950 回答