1

我在阅读维基百科后尝试计算百分位数我实现了简单的公式

def _percentile(numList, percentile):
    numList.sort()
    n = int(round(percentile * len(numList) + 0.5))
    if n > 1:
        return numList[n-2]
    else:
        return 0

但我想做的是wiki中提到的插值版本:(http://en.wikipedia.org/wiki/Percentile#Linear_interpolation_between_closest_ranks)我在谷歌搜索并找到了numpy,但我认为我没有得到正确的即使是简单的公式,我也使用它时的价值。当我尝试传入值来进行插值时,它给了我错误。(http://docs.scipy.org/doc/numpy-dev/reference/generated/numpy.percentile.html

让我们从以下列表开始:

B = [15, 20, 35, 40, 50]

根据我的方法:我得到了代表我正在寻找的百分位数的原始列表的实际值:

>>> print percentile(B, P=0.)
0
>>> print percentile(B, P=0.1)
0
>>> print percentile(B, P=0.2)
15
>>> print percentile(B, P=0.3)
15
>>> print percentile(B, P=0.4)
20
>>> print percentile(B, P=0.5)
20
>>> print percentile(B, P=0.6)
35
>>> print percentile(B, P=0.7)
35
>>> print percentile(B, P=0.8)
40
>>> print percentile(B, P=0.9)
40
>>> print percentile(B, P=0.95)
40
>>> print percentile(B, P=1.0)
50

但是,如果我使用 numpy,我不会得到代表原始列表的实际值。

>>> np.percentile(B, 0.1)
15.02
>>> np.percentile(B, 0.2)
15.039999999999999
>>> np.percentile(B, 0.3)
15.06
>>> np.percentile(B, 0.4)
15.08
>>> np.percentile(B, 0.5)
15.1
>>> np.percentile(B, 0.6)
15.120000000000001
>>> np.percentile(B, 0.7)
15.140000000000001
>>> np.percentile(B, 0.8)
15.16
>>> np.percentile(B, 0.9)
15.18
>>> np.percentile(B, 1)
15.199999999999999
>>> np.percentile(B, 10)
17.0
>>> np.percentile(B, 20)
19.0
>>> np.percentile(B, 30)
23.0
>>> np.percentile(B, 40)
29.0
>>> np.percentile(B, 50)
35.0

我的问题是一个数组,如何通过使用线性插值技术计算百分位数,从该数组中获取表示百分位数(例如 10、20...100)的值?

4

2 回答 2

1

我有同样的问题。对我来说,这很简单……我认为百分位参数(你称之为 P)是 0.0-1.0 的浮点数,其中 1.0 代表 100% 的百分位。

我刚刚阅读了手册,发现 P 在 0-100 的范围内,其中 100 代表 100%-percentile。

numpy.percentile(a, q, axis=None, out=None, overwrite_input=False, interpolation='linear')

q :在 [0,100] 范围内的浮点数(或浮点数序列)要计算的百分比必须介于 0 和 100 之间(含)。

http://docs.scipy.org/doc/numpy-dev/reference/generated/numpy.percentile.html

希望有帮助!

于 2014-08-01T23:31:11.593 回答
0

numpy 正在做正确的事情。

您的代码返回 的百分位数numList + [0],即包含 0 的集合。

第 0 个百分位项目将是 中的最低项目numList,在示例中为 15。

于 2013-10-05T01:30:43.970 回答