我有一个适合我的数据的伽马分布,使用libary(fitdistrplus)
. 我需要确定一种方法来定义可以“合理”预期的 x 值范围,类似于使用具有正态分布的标准偏差。
例如,与平均值相差两个标准差内的 x 值可以被认为是正态分布的预期值的合理范围。关于如何根据伽马分布的形状和速率参数定义类似范围的预期值有什么建议吗?
...也许类似于识别 x 的两个值,这两个值之间包含 95% 的数据?
我有一个适合我的数据的伽马分布,使用libary(fitdistrplus)
. 我需要确定一种方法来定义可以“合理”预期的 x 值范围,类似于使用具有正态分布的标准偏差。
例如,与平均值相差两个标准差内的 x 值可以被认为是正态分布的预期值的合理范围。关于如何根据伽马分布的形状和速率参数定义类似范围的预期值有什么建议吗?
...也许类似于识别 x 的两个值,这两个值之间包含 95% 的数据?
伽马的平均期望值为:
E[X] = k * theta
方差是Var[X] = k * theta^2
位置、k
形状和theta
比例。
但通常我会使用 95% 的分位数来表示数据传播。
假设我们有一个随机变量,它是 gamma 分布的 shapealpha=2
和 rate beta=3
。我们希望这个分布具有平均 2/3 和标准偏差sqrt(2)/3
,实际上我们在模拟数据中看到了这一点:
mean(rgamma(100000, 2, 3))
# [1] 0.6667945
sd(rgamma(100000, 2, 3))
# [1] 0.4710581
sqrt(2) / 3
# [1] 0.4714045
将置信范围定义为 会很奇怪[mean - gamma*sd, mean + gamma*sd]
。要了解原因,请考虑我们是否gamma=2
在上面的示例中进行了选择。这将产生置信区间[-0.276, 1.609]
,但伽马分布甚至不能取负值,4.7% 的数据落在 1.609 以上。这至少不是一个平衡良好的置信区间。
更自然的选择可能是将分布的 0.025 和 0.975 百分位数作为置信范围。我们预计 2.5% 的数据将低于该范围,2.5% 的数据将高于该范围。我们可以使用qgamma
来确定对于我们的示例参数,置信范围将是[0.081, 1.857]
。
qgamma(c(0.025, 0.975), 2, 3)
# [1] 0.08073643 1.85721446