2

文档

zipf 的概率质量函数为:

zipf.pmf(k, a) = 1/(zeta(a) * k**a) 对于 k >= 1。

zipfa作为形状参数。

上面的概率质量函数以“标准化”形式定义。要转移分布,请使用 loc 参数。具体来说,zipf.pmf(k, a, loc) 等同于 zipf.pmf(k - loc, a)。

但是aandk指的是什么?“形状参数”是什么意思?

此外,在 中scipy.stats.zipf.interval,还有一个alpha参数。

.interval()方法的描述很简单:

包含分布的 alpha 百分比的范围的端点

参数是什么alpha意思?那是“置信区间”吗?

4

1 回答 1

4

“形状参数”是什么意思?

顾名思义,形状参数决定了分布的形状。当从形状参数不是什么开始时,这可能最容易解释:

  1. 位置参数会改变分布,但在其他方面保持不变。例如,正态分布的平均值是一个位置参数。如果X正态分布 均值mu, 那么X + a正态分布 均值mu + a

  2. 尺度参数使分布更宽或更窄。例如,正态分布的标准差是一个尺度参数。如果X是 正 态 分布 与 标准 偏差sigma, 那么X * a是 正态 分布 与 标准 偏差sigma * a.

  3. 最后,形状参数改变分布的形状。例如,Gamma 分布有一个形状参数k,它决定了分布的偏斜程度(= 它“倾斜”到一侧的程度)。

但是aandk指的是什么?

k是分布参数化的变量。zipf.pmf你可以计算任何k给定形状参数a的概率。下图展示了如何a改变分布的形状(不同 k 的个体概率)。

在此处输入图像描述

a使得大的值k非常不可能,而低a则使得小k的可能性较小,而较大k的可能。

参数是什么alpha意思?那是“置信区间”吗?

说这alpha 置信区间是错误的。它是置信水平。我想这就是你的意思。例如,alpha=0.95意味着您有 95% 的置信区间。如果您k从特定分布生成随机 s,则其中 95% 将在zipf.interval.

情节代码:

from scipy.stats import zipf
import matplotlib.pyplot as plt
import numpy as np

k = np.linspace(0, 10, 101)

for a in [1.3, 2.6]:
    p = zipf.pmf(k, a=a)

    plt.plot(k, p, label='a={}'.format(a), linewidth=2)

plt.xlabel('k')
plt.ylabel('probability')

plt.legend()
plt.show()
于 2017-03-22T12:46:30.087 回答