我想使用百分位范围将我的数据分成 10 个箱(直方图):
bins = [0, 10th-percentile(myData), 20th-percentile(myData), 30th..., 90th-percentile(myData), +inf]
因此,为了从我的数据中制作直方图,我只是这样做:
import numpy as np
myBinnedData = np.histogram(myData, bins=bins)[0]
我的问题是我有几条领带,myData
每当一条领带跨越两个或更多箱时,np.histogram
只会将所有值放在第一个箱中,第二个为空。
这是因为bin 范围将有两个连续相等的值(X-percentile(myData) == Y-percentile(myData)
我该如何解释呢?