所以我有这个大数据框,里面有很多列,比如年龄、姓名、性别等。
我想创建一个年龄组在 1-10、11-20、21-30、...、71-80 之间的新专栏
我试着做
ranges = [1, 10, 20, 30, 40, 50, 60, 70, 80]
df.age.groupby(pd.cut(df.age, ranges)).count()
结果是
age
(1, 10] 64
(10, 20] 162
(20, 30] 361
(30, 40] 210
(40, 50] 132
(50, 60] 62
(60, 70] 27
(70, 80] 6
Name: age, dtype: int64
这正是我想要的,但组不正确。我希望它是 1-10,然后是 11-20,而不是 1-10 和 10-20。有人可以帮我解决这个问题吗?