我正在尝试使用 PyMC 实现一个非常简单的大数定律示例。目标是生成不同大小样本的许多样本平均值。例如,在下面的代码中,我反复采集 5 个样本组 (samples_to_average = 5),计算它们的平均值,然后找到结果轨迹的 95% CI。
下面的代码运行,但我想做的是将 samples_to_average 修改为一个列表,以便我可以一次计算一系列不同样本大小的置信区间。
import scipy.misc
import numpy as np
import pymc as mc
samples_to_average = 5
list_of_samples = mc.DiscreteUniform("response", lower=1, upper=10, size=1000)
@mc.deterministic
def sample_average(x=list_of_samples, n=samples_to_average):
samples = int(n)
selected = x[0:samples]
total = np.sum(selected)
sample_average = float(total) / samples
return sample_average
def getConfidenceInterval():
responseModel = mc.Model([samples_to_average, list_of_samples, sample_average])
mapRes = mc.MAP(responseModel)
mapRes.fit()
mcmc = mc.MCMC(responseModel)
mcmc.sample( 10000, 5000)
upper = np.percentile(mcmc.trace('sample_average')[:],95)
lower = np.percentile(mcmc.trace('sample_average')[:],5)
return (lower, upper)
print getConfidenceInterval()
我见过的大多数使用确定性装饰器的示例都使用全局随机变量。但是,为了实现我的目标,我认为我需要做的是在 getConfidenceInterval() 中创建一个随机变量(长度正确),并将其传递给 sample_average(而不是使用全局/默认参数提供 sample_average)。
如何将在 getConfidenceInterval() 中创建的变量传递给 sample_average(),或者,我可以使用不同的 samples_to_average 值评估多个模型的另一种方法是什么?如果可能的话,我想避免使用全局变量。