3

如果我知道我的样本量是 449,平均值是 81.69,中位数是 81.68,第 30 个百分位数是 79.43,第 90 个百分位数是 85.06,我如何估计分布?

4

2 回答 2

3

您的样本大小与这个问题无关(它可能对计算置信区间很有用)。您必须处理的是三个分位数(平均值、第 30 位和第 90 位)。由于中位数实际上与平均值相同,这暗示您的分布很可能是对称的。在那之后,你几乎是死路一条。您可以将这些数据点拟合到高斯或超高斯(或任何所谓的 exp(x^4) )或任意数量的衰减对称分布。

于 2013-11-05T16:31:46.640 回答
3

具有已知均值和方差的最高熵分布是正态分布,只要数据与其不一致,我们就可以在这里使用它。现在使用给定的平均值并将标准差估计为:

q30 <- 79.43
q90 <- 85.06
SD <- (q90 - q30) / (qnorm(.9) - qnorm(.3))

我们得到平均值为 81.69 和标准差的正态分布SD。在这里,我们使用了我们给出的平均值,只是注意到中位数与平均值几乎相同并不与正态分布不一致,我们使用剩余的两个分位数来估计标准偏差。

于 2013-11-05T17:18:52.887 回答