我正在尝试开发一个线性回归模型,用于从手印测量中估计身高。我想采用贝叶斯方法并从以前的研究中定义信息先验。我有一个包含几个预测变量(几个线性测量)和身高测量(作为目标变量)的数据集。
从以前的研究中,有关于线性回归模型的相同变量和公式的描述性统计(均值和标准差)的信息。所以,我的问题是,我如何使用这些信息来为我的研究提取信息先验?例如,我从之前的研究中获得了变量 HL 和身材的数据:
平均值 (HL) = 17.94, SD (HL) = 0.94, 平均值 (STATURE) = 178.5, SD (STATURE) = 7.05, 范围 (STURE) = (162.4–200.5)
身高估计模型 = 69.723 +5 .567 x HL, SEE = 4.83, r = 0.73
我如何使用它们在我的模型中构造prior和prior_intercept
Model <- stan_glm(STATURE ~ HL, data = mydata, prior = ?, prior_intercept = ?)
此外,由于我的人口和先前研究的人口中的输出变量(身高)可能存在差异,有没有办法根据其他研究的结果来构建目标变量的先验。例如,如果我知道我的人口中的平均身高是 180 +/- 5 厘米。
我一直在寻找各种来源的解释(例如http://mc-stan.org/rstanarm/articles/priors.html),但是没有指南如何从以前的研究中构建信息先验。