我正在分析纵向面板数据,其中个人在马尔可夫链中的不同状态之间转换。我正在使用一系列多项逻辑回归对状态之间的转换率进行建模。这意味着我最终得到了大量的回归斜率。
对于每个回归斜率,我获得一个后验分布(使用 WinBUGS)。从后验分布中,我们得到与所讨论的斜率相关的均值、标准差和 95% 可信区间。
我最终感兴趣的值是预期的第一次通过马尔可夫链的时间(“命中时间”)。这是所有不同预测变量的函数,因此是由多项逻辑回归产生的许多回归斜率构建的。
一种简单的方法是将每个后验分布的平均值作为每个回归斜率的点估计,并在一系列不同的预测变量值处求解预期的首次通过时间。我现在已经这样做了,但它可能具有误导性,因为它没有显示预期首次通过时间的预测值的不确定性。
我的问题是:如何计算预期第一次通过时间的可信区间?
我的第一个想法是通过模拟来近似误差,通过从每个后验分布中采样回归斜率的单个值,在给定这些值的情况下获得预期的第一次通过时间,然后绘制所有这些模拟值的标准偏差。但是,我觉得(a)这会让统计学家尖叫,(b)它没有考虑到不同的后验分布将相关的事实(它独立地从每个分布中采样)。
在 WinBUGS 中,您实际上可以获得后验分布之间的相关性。因此,如果模拟的想法是合适的,我理论上可以模拟包含这些相关性的回归斜率系数。
有没有更直接、更不近似的方法来找到不确定性?例如,我可以使用 WinBUGS 来找到给定一组预测变量值的预期首次通过时间的后验分布吗?很喜欢这个问题的答案:定义一个新节点并监控它。我会想象定义一系列新节点,其中每个节点用于一组不同的实际预测值,并监控每个节点。这是否具有良好的统计意义?
对此的任何想法将不胜感激!