我有一个非常简单的数据框:
df = pd.DataFrame([5,7,10,15,19,21,21,22,22,23,23,23,23,23,24,24,24,24,25], columns=['val'])
df.median() = 23 这是正确的,因为从列表中的 19 个值中,23 是第 10 个值(23 之前的 9 个值,23 之后的 9 个值)
我试图将第一和第三四分位数计算为:
df.quantile([.25, .75])
val
0.25 20.0
0.75 23.5
我原本预计,从低于中位数的 9 个值来看,第一个四分位数应该是 19,但正如您在上面看到的,python 说它是 20。同样,对于第三个四分位数,从右到左的第五个数字是 24,但 python 显示为 23.5。
熊猫如何计算四分位数?