我在阅读维基百科后尝试计算百分位数我实现了简单的公式
def _percentile(numList, percentile):
numList.sort()
n = int(round(percentile * len(numList) + 0.5))
if n > 1:
return numList[n-2]
else:
return 0
但我想做的是wiki中提到的插值版本:(http://en.wikipedia.org/wiki/Percentile#Linear_interpolation_between_closest_ranks)我在谷歌搜索并找到了numpy,但我认为我没有得到正确的即使是简单的公式,我也使用它时的价值。当我尝试传入值来进行插值时,它给了我错误。(http://docs.scipy.org/doc/numpy-dev/reference/generated/numpy.percentile.html)
让我们从以下列表开始:
B = [15, 20, 35, 40, 50]
根据我的方法:我得到了代表我正在寻找的百分位数的原始列表的实际值:
>>> print percentile(B, P=0.)
0
>>> print percentile(B, P=0.1)
0
>>> print percentile(B, P=0.2)
15
>>> print percentile(B, P=0.3)
15
>>> print percentile(B, P=0.4)
20
>>> print percentile(B, P=0.5)
20
>>> print percentile(B, P=0.6)
35
>>> print percentile(B, P=0.7)
35
>>> print percentile(B, P=0.8)
40
>>> print percentile(B, P=0.9)
40
>>> print percentile(B, P=0.95)
40
>>> print percentile(B, P=1.0)
50
但是,如果我使用 numpy,我不会得到代表原始列表的实际值。
>>> np.percentile(B, 0.1)
15.02
>>> np.percentile(B, 0.2)
15.039999999999999
>>> np.percentile(B, 0.3)
15.06
>>> np.percentile(B, 0.4)
15.08
>>> np.percentile(B, 0.5)
15.1
>>> np.percentile(B, 0.6)
15.120000000000001
>>> np.percentile(B, 0.7)
15.140000000000001
>>> np.percentile(B, 0.8)
15.16
>>> np.percentile(B, 0.9)
15.18
>>> np.percentile(B, 1)
15.199999999999999
>>> np.percentile(B, 10)
17.0
>>> np.percentile(B, 20)
19.0
>>> np.percentile(B, 30)
23.0
>>> np.percentile(B, 40)
29.0
>>> np.percentile(B, 50)
35.0
我的问题是一个数组,如何通过使用线性插值技术计算百分位数,从该数组中获取表示百分位数(例如 10、20...100)的值?