1

我正在尝试计算列的四分位数。然而,我使用的任何类型的函数(到目前为止,我尝试使用 numpy 百分位数和 pandas 分位数,插值最接近、更高、更低、线性)它们总是返回不准确的四分位数。我从这里的链接检查了。是否有任何函数可以真正返回准确的四分位数,或者最好让我们自己的函数准确计算它?因为我在另一个答案中看到有人创建了自己的函数来计算

这是我的专栏,结果应该是,Q1,Q3 = 200,650但显示的是Q1,Q3 = 200,500。无论我使用什么插值,总会有不准确的结果。

cols = pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})
4

1 回答 1

3

在我们删除重复项后,当您不删除重复项时,该值将关闭quantile

s=pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})
s.drop_duplicates().quantile([0.25,0.75])
Out[13]: 
      numbers
0.25    250.0
0.75    650.0
于 2020-02-21T15:02:17.807 回答