1

我有一个关于使用熊猫分箱的问题!这是一个简化的示例:我有一个数据框 df

     time  speed
0    0.1     20
1    0.2     20
2    0.3     30
3    0.4     30
4    0.5     40
5    0.6     40
6    0.7     40
7    0.8     40
8    0.9     50
9    1.0     50
10   1.1     60
11   1.2     70
12   1.3     80
13   1.4     80
14   1.5     80
15   1.6     80
16   1.7     40
17   1.8     40
18   1.9     40

这就是我想做的事情:我想对速度数据进行分类,例如 bins = [0,20,40,60,80]。然后,我希望根据速度分级对时间列值进行分级。之后,我想在垃圾箱中累积时间并绘制直方图。请帮忙

4

1 回答 1

2
In [117]: binned_time = df.groupby(pd.cut(df.speed, bins=[0,20,40,60,80]))['time']                                                                                                                                                                                        

In [118]: binned_time.sum()
Out[118]: 
speed
(0, 20]     0.30
(20, 40]    3.30
(40, 60]    1.11
(60, 80]    1.24
Name: time, dtype: float64
于 2013-08-29T14:00:45.000 回答