1

使用 scipy,我想衡量我的对数正态分布生成随机变量的可能性有多大。

为此,我考虑查看它与 PDF 最大值的距离。

到目前为止,我的方法是这样的:如果变量是r = 1.5,并且分布 σ=0.5,则从 PDF 中找到值lognorm.pdf(r, 0.5, loc=0)。鉴于结果,(0.38286..),然后我想查找下面的 PDF 区域0.38286..

最后一步如何实施?这甚至是解决这个问题的正确方法吗?

举一个更一般的问题示例。假设有人告诉我他们在推特上有 126 个关注者。我知道 Twitter 关注者是对数正态分布,我有该分布的 PDF。鉴于这种分布,我是否可以确定这个追随者数量的可信度?

4

2 回答 2

2

PDF 下的区域是CDF(方便地是lognorm中的一种方法):

lognorm.cdf(r, 0.5, loc=0)

.

您可以使用它来计算的一件事是折叠累积分布(此处提到),也称为“山图”:

FCD = 0.5 - abs(lognorm.cdf(r, 0.5, loc=0) - 0.5)
于 2012-09-20T09:53:23.283 回答
0

与海登的结果相同

对于非对称分布的统计检验,我们通过取两个尾概率中的最小值来获得 pvalue

>>> r = 1.5
>>> 0.5 - abs(lognorm.cdf(r, 0.5, loc=0) - 0.5) 
0.20870287338447135
>>> min((lognorm.cdf(r, 0.5), lognorm.sf(r, 0.5)))
0.20870287338447135

这通常加倍以获得双边 p 值,但最近有一些论文提出了加倍的替代方案。

于 2012-09-22T13:53:38.793 回答