0

我有随时间推移的年度数据(纵向数据),并对许多受试者进行重复测量。我认为我需要多级建模/回归来处理随着时间的推移对同一个人的肯定相关的测量集群。目前每年的数据都在单独的表格中。

我想知道 scikit-learn 中是否有一种内置方法,比如 LinearRegression(),它能够进行多级回归,其中 Level 1 是多年来的所有数据,Level 2 是集群上的受试者(每个受试者随时间测量的集群)。如果是这样,最好将纵向数据按长度排列(每个受试者随时间的测量都在一行中)或堆叠(每年的每个测量都是它自己的行)。

有没有办法做到这一点?

4

1 回答 1

1

多级模型中随机效应的估计并非易事,您通常必须求助于贝叶斯推理方法。

我建议您查看贝叶斯推理包,例如 pymc3 或 BRMS(如果您知道 R),您可以在其中指定这样的模型。或者,查看 R 中的 lme4 包以获得多级模型的完全频繁实现。

另外,我认为您可以从“睡眠剥夺”数据集中获得一些灵感,该数据集用作纵向数据分析的教科书示例(https://cran.r-project.org/web/packages/lme4 /vignettes/lmer.pdf ) 第 4 页

要开始使用 pymc3,请查看此处:

https://github.com/fonnesbeck/Bios8366/blob/master/notebooks/Section4_7-Multilevel-Modeling.ipynb

于 2020-12-04T12:19:11.883 回答