1

背景:我使用 SVGP 和泊松似然(和日志/exp 链接)训练了一个模型。除了预测计数之外,我还想要一个不确定性度量。

该函数m.predict_y提供预测均值和预测方差。对于泊松似然Likelihood.predict_mean_and_var,它使用Gauss-Hermite 正交的默认实现。

这是计算计数的期望(即我们的目标/因变量)还是泊松参数的期望?

  • (i) 如果它是泊松参数的预测均值/方差,如何使用该方差来获得有意义的可信区间?

  • (ii) 如果它是计数的预测均值/方差,那么均值是否应该与方差相同(因为我们整合了除 y 和 y 之外的所有内容是泊松分布的)?还是我误解了预测方差的概念?

如果我正确理解代码,我们会得到泊松参数 (i) 的预测均值/方差。

在我目前的方法中,我重写predict_mean_and_var了它,以便它使用 mcmc 方法ndiag_mc_perc而不是 Hermite-gauss 近似,然后只返回样本的 10%/90% 百分位数。

4

1 回答 1

1

简短回答:predict_y预测y的均值和方差,它始终在观察空间中,即Y您传递给模型构造函数的 live 所在的空间。在这种情况下,它是计数的均值和方差,即您的第二点 (ii)。对于泊松分布,给定强度,均值和方差始终相同(等于强度),即取决于潜在 GP f的值;predict_y由于整合了f中的不确定性,泊松似然模型返回的均值和方差之间会有微小的差异。

如果您有多个观察结果,那么谈论强度的不确定性才真正有意义,但是在 GPflow 中实现的泊松似然中,一个观察值Y构成一个观察值(因为每个观察值通常包含许多事件)。您可以建立一个了解多个观察结果的可能性,然后您会看到更多观察结果的不确定性减少,正如您所期望的那样。

(如果您的计数方差等于计数期望,您可能需要考虑计数不足或过度分散的可能性,例如负二项式或其他。)

于 2019-08-29T16:33:58.660 回答